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OM nucleic - nucleic search, using sw model 
Run on: 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



September 8, 2004, 04:02:58 ; Search time 17438 Seconds 

(without alignments) 
13768.318 Million cell updates/sec 

US-10-088-467-1 
8040 

1 ccgcggcgctgaggcggcgg aaataaataaacaaaatgtc 8040 

IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 27513289 seqs, 14931090276 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



55026578 



Post-processing: 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database : 



EST: 
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em_estba : * 
em_esthum: * 
em_estin: * 
em_estmu: * 
em_estov: * 
em_estpl : * 
em_estro : * 
em_htc: * 
gb_estl : * 
gb_est2:* 
gb_htc: * 
gb_est3: * 
gb_est4 : * 
gb_est5: * 
em_estfun: * 
em_es torn: * 
em_gss_hum: * 
em_gss_inv: * 
em_gss_pln : * 
em__gss_vrt : * 
em_gss_fun: * 
em_gss_mam: * 
em_gss_mus : * 
em_gss_pro : * 
em_gss_rod: * 
em_gss_phg: * 
em_gss_vrl : * 



28: gb_gssl:* 
29: gb_gss2:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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Result Query 





No. 


Score 


Match 


Length 


DB 


ID 


Description 




1 


3583.4 


44.6 


6117 


29 


AY421584 


AY421584 


Homo sapi 




2 


2415.4 


30. 0 


5289 


29 


AY421585 


AY421585 


Pan trogl 




3 


2347.4 


29.2 


5743 


29 


AY421586 


AY421586 


Mus muscu 




4 


1903.4 


23.7 


2065 


11 


BC029282 


BC029282 


Homo sapi 




5 


965 


12. 0 


6600 


29 


AY405473 


AY405473 


Mus muscu 




6 


952.2 


11.8 


6606 


29 


AY405471 


AY405471 


Homo sapi 




7 


942. 8 


11.7 


6606 


29 


AY405472 


AY405472 


Pan trogl 




8 


923.2 


11.5 


1045 


13 


BX341657 


BX341657 


BX341657 




9 


901.4 


11.2 


1078 


12 


BM548310 


BM548310 


AGENCOURT 




10 


901.4 


11.2 


1201 


13 


BX374888 


BX374888 


BX374888 




11 


900.4 


11.2 


964 


9 


AL525194 


AL525194 AL525194 


c 


12 


893.2 


11.1 


958 


9 


AL525193 


AL525193 AL525193 


c 


13 


886.2 


11.0 


1201 


9 


AL540221 


AL540221 AL540221 




14 


873.2 


10.9 


1082 


13 


BX420933 


BX420933 


BX420933 




15 


854 


10.6 


1201 


13 


BX376831 


BX376831 


BX376831 




16 


819 


10.2 


1039 


12 


BM925723 


BM925723 


AGENCOURT 




17 


796.2 


9.9 


1066 


12 


BM907138 


BM907138 


AGENCOURT 




18 


780.8 


9.7 


1129 


12 


BM807409 


BM807409 


AGENCOURT 




19 


775.2 


9.6 


904 


13 


BQ645609 


BQ645609 


AGENCOURT 




20 


763.4 


9.5 


1201 


13 


BX382919 


BX382919 


BX382919 




21 


761. 8 


9.5 


986 


12 


BI821324 


BI821324 


603038167 




22 


751.4 


9.3 


1054 


12 


BM544515 


BM544515 


AGENCOURT 




23 


747 


9.3 


755 


12 


BI488407 


BI488407 


603020905 




24 


745. 6 


9.3 


929 


14 


CA488118 


CA488118 


AGENCOURT 




25 


745.4 


9.3 


878 


14 


CA454711 


CA454711 


AGENCOURT 




26 


740.2 


9.2 


982 


13 


BQ720264 


BQ720264 


AGENCOURT 




27 


738.2 


9.2 


884 


13 


BX403079 


BX403079 


BX403079 




28 


737.2 


9.2 


886 


13 


BX374444 


BX374444 


BX374444 




29 


722.2 


9.0 


857 


12 


BG491295 


BG491295 


602535365 




30 


718 


8.9 


1158 


12 


BM547655 


BM547655 


AGENCOURT 




31 


711 


8.8 


742 


14 


CF455392 


CF455392 


AGENCOURT 




32 


690 


8.6 


879 


14 


CA454786 


CA454786 


AGENCOURT 




33 


689.6 


8.6 


791 


12 


BI195329 


BI195329 


602944676 


c 


34 


689 


8.6 


719 


14 


CA419218 


CA419218 


UI-H-EZ1- 




35 


684 


8.5 


688 


12 


BG823114 


BG823114 


602726452 


c 


36 


684 


8.5 


715 


13 


BQ574216 


BQ574216 


UI-H-EZ1- 




37 


682.2 


8.5 


1201 


9 


AL540222 


AL540222 AL540222 




38 


680 


8.5 


736 


10 


BF205935 


BF205935 


601869564 




39 


678.2 


8.4 


1117 


13 


BQ067042 


BQ067042 


AGENCOURT 




40 


676.6 


8.4 


796 


14 


CA317680 


CA317680 


UI-M-FW0- 


c 


41 


672.4 


8.4 


715 


13 


BQ448041 


BQ448041 


UI-H-EU1- 




42 


672.4 


8.4 


735 


12 


BG403849 


BG403849 


602419692 




43 


671. 8 


8.4 


695 


12 


BM479039 


BM479039 


AGENCOURT 




44 


669.4 


8.3 


694 


12 


BI820797 


BI820797 


603034004 




45 


669.4 


8.3 


914 


13 


BQ962877 


BQ962877 


AGENCOURT 



ALIGNMENTS 



RESULT 1 
AY421584 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 

FEATURES 

source 



gene 



ORIGIN 



AY421584 6117 bp DNA linear GSS 17-DEC-2003 

Homo sapiens ABCA2 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
AY421584 

AY421584.1 GI:39748443 
GSS . 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 6117) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Ke j ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 

Inferring nonneutral evolution from human- chimp-mouse orthologous 
gene trios 

Science 302 (5652), 1960-1963 (2003) 
14671302 

2 (bases 1 to 6117) 

Clark,A.G., Glanowski, S . , Nielson,R., Thomas, P., Kej ariwal, A. , 
Todd, M. A., Tanenbaum, D.M. , Civello, D . R. , Lu,F., Murphy, B., 
Ferriera,S., Wang,G., Zheng, X.H., White, T. J., Sninsky, J. J. , 
Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 16-NOV-2003 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. 

Location/Qualifiers 

1. .6117 

/organism="Homo sapiens" 
/mol_type="genornic DNA" 
/db_xref="taxon: 9606" 
<1. .>6117 
/gene="ABCA2" 
/locus_tag="HCM7606" 



Query Match 44.6%; Score 3583.4; DB 29; Length 6117; 

Best Local Similarity 60.0%; Pred. No. 0; 

Matches 3597; Conservative 0; Mismatches 2400; Indels 3; Gaps 1; 

Qy 101 TGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTG 160 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTG 60 

QY 161 CGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTG 220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 C G AC AG AAG AAG C C C AC CAT C T C C GT GAAG GAAG CCTTCTACACAGCGGCGCCCCTG 117 



Qy 221 ACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAG 28 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I 
Db 118 AC GT CT GC C G GC AT CCTGCCTGT CAT GC AAT CGCT GT GC C C GGAC GGC C AG C GAGAC GAG 177 

Qy 281 TTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGC 34 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 178 TT C GGCTT C CT GCAGT ACGC CAACT C CACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 237 

Qy 341 GTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAG 4 00 

Db 23 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 297 

Qy 401 GCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTG 4 60 

Db 298 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 357 

Qy 4 61 GAC AGAT C CACAGT GT CT T C CT T CT CT CT GGACT C GGT GGC CAGAAAC C C G C AGGAG CT C 520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 358 NNNNNNNNNNNNNTGTCTTCCTTCTCTCT GGACT CGGTGGCCAGAAACCCGCAGGAGCTC 417 

Qy 521 TGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCC 580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 418 TGGCGTTTCCT GAC GCAAAACTT GT C GCT GCCCAATAGCACGGCCCAAGCACTCTT GGC C 477 

Qy 581 GCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGAT 640 

I I I I I I I I I I I I I I I I I I I I I 
Db 478 GCCCGTGTGGACCCGCCCGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 537 

Qy 641 TCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTG 7 00 

Db 538 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 597 

Qy 701 TTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCG 7 60 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 598 NNNNNNNNNNNNGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCG 657 

Qy 7 61 GGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAG 820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I 
Db 658 GGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAG 717 

Qy 821 GGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGG 88 0 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 718 GGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGG 77 7 

Qy 881 CTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTG 940 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 CTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTG 837 

Qy 941 GATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCG 1000 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 GATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCG 897 

Qy 1001 CTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCC 1060 

I I I II I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 898 CTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCC 957 



Qy 1061 CTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGT 1120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 958 CTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGT 1017 

Qy 1121 GGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACC 1180 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I 
Db 1018 GGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACC 1077 

Qy 1181 GCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAG 124 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 107 8 GCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAG 1137 

Qy 1241 TGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGC 1300 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 1 1 M I I I I I I I I I I I I I I I I i I I I 

Db 1138 TGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGN 1197 

Qy 1301 ACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAG 1360 

Db 1198 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1257 

Qy 1361 GAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTAC 1420 

Db 1258 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1317 

Qy 1421 GCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTT 14 8 0 

I I I I I I I I I I I I I I I I I I I I I 
Db 1318 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCCAACGAGACTTTTGCTTTT 1377 

Qy 14 81 GTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGC 1540 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 137 8 GTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGC 1437 

Qy 1541 TTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAG 1600 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1438 TTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAG 1497 

Qy 1601 CTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGA 1660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1498 CTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGA 1557 

Qy 1661 C AG GAC AACT TCTCGCTGCC C AGT G G CAT GGCCCTCCTG C AG C AG CT G GAT AC CAT T GAC 172 0 

I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I 
Db 1558 CAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGAC 1617 

Qy 1721 AACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGC 178 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1618 AACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGNNNNNNNNNNNNNNNNNNNNNNNN 1677 

Qy 1781 T T C C C C GAC GAGGAGAGCAT T GT CAACT AC AC C CT CAAC CAGGC CT AC C AG GACAAC GT C 1840 

Db 167 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1737 

Qy 1841 ACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTG 1900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1738 NNNNNNNNNNNNNNNNNNNNCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTG 1797 

Qy 1901 C AC T AC AAG AT C C G C C AG AAC T C C AG C T T C AC C G A G AAAAC CAAC GAGAT CCGCCGCGCC 1960 



Db 17 98 C ACT ACAAGAT C C GC C AGAACT C C AGCT T C AC C GAGAAAAC CAAC GAGAT CCGCCGCGCC 1857 

Qy 1961 TACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGG 202 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1858 TACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGG 1917 

Qy 2021 AT CCAGGACAT GATGGAGCGCGCCAT CAT CGACACTTTT GT GGGGCAC GACGT GGT GGAG 2080 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1918 AT C C AGGAC AT GAT G GAGCGC G C CAT CAT C GACACT T T T GT GG G GC AC GAC GT GGT GGAG 1977 

Qy 2081 CCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTT 2140 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I 
Db 1978 CCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTT 2037 

Qy 2141 GTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATG 2200 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 038 GT CAT T GAG C AC AT GAT G CC GC T GT GC AT GGT GAT CT C CT GGGT C TACT C C GT GGC CAT G 2 097 

Qy 2201 ACC ATCCAGCACATC GT GGCGGAGAAGGAGCACCGGCT CAAGGAGGTGAT GAAGAC CAT G 2260 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2 0 98 AC CAT CCAGCACATC GT GGC GGAGAAGGAGCACCGGCT CAAGGAGGTGAT GAAGAC CAT G 2157 

Qy 22 61 GGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCC 2320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 2158 GGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCC 2217 

Qy 2321 AT C T C C GT GAC AG C AC T C AC C G C CAT C C T G AAGT AC GGC C AG GT G C T TAT G C AC AG C C AC 2380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2218 ATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCAC 2277 

Qy 2381 GTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTC 2440 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 2278 GTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTC 2337 

Qy 2441 CTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTAC 2500 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I 

Db 2338 CTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTAC 2397 

Qy 2501 TTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAG 2560 

I I II I II I I I I I I II I I I I II I I I I II I I I I I I II I I I I II I I I I I I II I I I I I I II I I I 
Db 2 398 T T C CT GAGCT ACGT GC C CT ACAT GT AC GT G G C GAT C C GAGAGGAGGT G GC GCAT GAT AAG 2457 

Qy 2561 ATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGC 2 620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2458 ATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGC 2517 

Qy 2 621 TCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGC 2 680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 2518 TCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGC 2577 

Qy 2681 CAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTG 2740 

I I I I I I I I I I II I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 257 8 CAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTG 2 637 

Qy 2741 GACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTAC 2 800 

I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I II I I I I I I I I I I 



Db 2638 GACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGNNNNNNNN 2697 

Qy 2 8 01 GGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGG 2 8 60 

Db 2 698 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 2757 

Qy 28 61 ACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAG 2920 

Db 2758 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 2 817 

Qy 2921 GAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAG 2980 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2818 NNNNACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAG 2 877 

Qy 2 9 81 GAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGAC 3040 

I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I | I I I I 
Db 287 8 GAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGAC 2 937 

Qy 3041 GACAAGAAGCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCC 3100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2938 GACAAGAAG CT GGC C CT GAACAAGCT GAG C C T GAAC C T C T AC GAGAAC C AG GT GGT CT C C 2997 

Qy 3101 TTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTC 3160 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2998 TTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTC 3057 

Qy 3161 C CT C CAAC GTCGGGTTCCGC C AC CAT CT AC G GGC AC GAC AT C C GCAC G GAGAT GGAT GAG 3220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3058 C CT C CAAC GT CGGGTTCCGC C AC CAT C T AC G GGC AC GACAT C C GCAC GGAGAT G GAT GAG 3117 

Qy 3221 ATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTG 32 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3118 AT CC GCAAGAAC CT GGGCAT GT GC C CNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 3177 

Qy 32 81 GAG GAACACCT CT G GT T CTACT C AC G GCT C AAGAGCAT GGCT CAG GAG GAGAT C C G C AGA 3340 

Db 317 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 32 37 

Qy 3341 GAGAT G GACAAGAT GAT C GAGGAC CT G GAGC T CT C CAACAAAC G GC ACT C ACT G GT GC AG 3400 

I I I I I I I I I I I I I I I I I I 

Db 3238 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCGGCACTCACTGGTGCAG 3297 

Qy 34 01 ACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCT 34 60 

I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I II 
Db 3298 ACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCT 3357 

Qy 34 61 CGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATC 352 0 

I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3358 CGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATC 3417 

Qy 3521 T GG GAC CT CAT C CT GAAGT ACAAG C C AGGC C GCAC CAT C CTT CT GT CCAC C C AC C AC AT G 3580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3418 T G GGAC CT CAT C C T GAAGT ACAAG C C AGGC C GCAC CAT CCTTCTGTC CAC C C AC C AC AT G 3477 

Qy 35 81 GATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGC 364 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 3478 GAT GAGGCT GAC CT G C T T GG GGAC C G CAT T G C CAT CAT CT C C CAT GG GAAGCT CAAGT G C 3537 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



3 641 TGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTC 3700 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I 
3538 TGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTC 35 97 

3701 AAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGT 3760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
3598 AAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGT 3657 

3761 CGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTG 382 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
365 8 CGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTG 3717 

3821 GCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAG 388 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3718 GCCTCCTGCCTGCTGGTCTCAGACACT^AGCACGGAGCTCTCCTACATCCTGCCCAGCGAG 3777 

3881 GCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCA 3940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
377 8 GCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCA 3837 

3941 CTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTG 4000 
I I I I I I I I I 

3838 CTGCACCTCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 3897 

4 001 TCGGAGGAGGATCAGT CGCT GGAGAACAGTGAGGCCGATGT GAAGGAGT CCAGGAAGGAT 4060 

I I II I I I I I I I I I I I I I I I I I I I 
389 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNATGTGAAGGAGTCCAGGAAGGAT 3957 

4061 GTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGG 412 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
3958 GTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGG 4017 

4121 TGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCC 4180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
4018 TGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCC 4077 

4181 CGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGAT 424 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 07 8 CGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGAT 4137 

4241 AACCCACAGGACCCAGACAAT GT CAGCCTGCAAGAGGT GGAGGCAGAGGCCCT GT CGAGG 4300 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I II 
4138 AACCCACAGGACCCAGACAAT GTCAGCCTGCAAGNNNNNNNNNNNNNNNNNNNNNNNNNN 4197 

4301 GTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGG 4360 

4198 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4257 

4361 CTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATC 4420 

425 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4317 

4421 TTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATT 44 80 

4318 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4377 



Qy 4481 GGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGT 4 54 0 

Db 437 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4437 

Qy 4541 GGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCC 4600 

Db 443 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 44 97 

Qy 4 601 GACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACC 4 660 

Db 449 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4557 

Qy 4661 TGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGG 4720 

Db 4558 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 617 

Qy 4721 GAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAG 47 8 0 

Db 4 618 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 677 

Qy 47 81 GGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCA 4 840 

Db 467 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 737 

Qy 4841 GCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCA 4 900 

Db 4738 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4797 

Qy 4 901 GAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACC 4 960 

I I I I I I II I I I I I I I I I I I II I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 47 98 NAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACC 4 857 

Qy 4 961 TGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAG 5020 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I I I I I I I I 

Db 4858 TGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAG 4 917 

Qy 5021 AT G C G GGT GGT C ACAGG CGACAT C CT GACC GACAT CACC GG C C ACAAT GT CT CT GAGT AC 5080 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 4918 AT GC G GGT GGT CACAGGC GACAT C CT GAC C GACAT CAC C G GC CACAAT GT C T CT GAGT AC 4977 

Qy 5081 CTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAAC 5140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4978 CTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAAC 5037 

Qy 5141 GTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATC 52 00 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5038 GTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATC 5097 

Qy 52 01 G C GGT G C GC AG G GC T G C C CAG GT T T T CT AC AACAAC AAGG GCT AT CAC AG CAT G C C CAC C 52 60 

I I I I I I I I I I I I I I I I I I I I I 
Db 5098 GCGGTGCGCAGGGCTGCCCAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5157 

Qy 5261 TACCTCAACAGCCTC7\ACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAAC 5320 

Db 5158 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5217 

Qy 5321 CCGGCGGCT T AC GG C AT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC CAG C GC C AGC C T C 5380 



Db 5218 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5277 

Qy 5381 TCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCC 5440 

Db 527 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5337 

Qy 5441 ATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCC 5500 

Db 5338 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5397 

Qy 5501 AAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTG 5560 

Db 539 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 54 57 

Qy 5561 TGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTC 5620 

Db 54 5 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5517 

Qy 5621 GACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTC 568 0 

Db 5518 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5577 

Qy 5681 TATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGC 574 0 

Db 557 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5637 

Qy 5741 TCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCC 5800 

Db 5638 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5697 

Qy 58 01 ACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTG 58 60 

Db 5698 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5757 

Qy 5861 AAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCC 5920 

Db 5758 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5817 

Qy 5921 T AC AAC GAGT AC AT C AAC GAGT AC T AC GC C AAGAT T G G C C AGT T T GAC AAGAT GAAGT C C 5980 

Db 5818 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5877 

Qy 5981 CCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTG 604 0 

Db 587 8 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5937 

Qy 6041 GGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCT 6100 

I 

Db 5938 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGT 5997 

RESULT 2 
AY421585 

LOCUS AY421585 5289 bp DNA linear GSS 17-DEC-2003 



DEFINITION Pan troglodytes ABCA2 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
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ORIGIN 



Query Match 30.0%; 
Best Local Similarity 56.4%; 
Matches 2419; Conservative 



Score 2415.4; DB 29; Length 5289; 
Pred. No. 0; 
0; Mismatches 1871; Indels 0; Gaps 



0; 



Qy 


932 


Db 


1 


Qy 


992 


Db 


61 


Qy 


1052 


Db 


121 


Qy 


1112 


Db 


181 



CTGGGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGG 991 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I 

CTGGGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGG 6 0 

CTGCAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTC 1051 

| I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II I I I I 

CTGCAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTC 12 0 

CTGTCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCC 1111 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I II I I I I II I I II I I I I I I I I II 

CTGTCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCC 180 

CCAGCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCC 1171 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I M 

CCAGCCAGCGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCC 240 



Qy 



1172 AACGCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTG 1231 



Db 


241 


AACGCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCTCCCCGGACACGCTG 


300 


Qy 


1232 


CAGGGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGC 

... i ■ i i i ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

| | | | | M | | I II 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 II 1 1 1 II 1 II 1 II II 1 II I 1 1 M M II II 

CAGGGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGC 


1291 


Db 


301 


360 


Qy 


1292 


AACAACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTC 
1 1 1 1 1 1 1 1 

AACAACCGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


1351 


Db 


361 


420 


Qy 


1352 


AC GAG C AAG GAG C AG C G G AAC CTGGGCCTCCTCGTG C AC C T CAT G AC C AG C AAC C C C AAA 


1411 


Db 


421 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


480 


Qy 


1412 


ATCCTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACT 

i i i i t i i i i i i i 
1 1 1 II 1 1 1 1 1 1 1 

NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCCT^ACGAGACT 


1471 


Db 


481 


540 


Qy 

Db 


1472 
541 


TTTGCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAG 

* i i i i i i i i i i i i i i i i i i i i i i i i i i i i I i I I I I 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 f 1 

I I I I 1 I I I I I 1 M 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 

TTTGCCTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAG 


1531 
600 


Qy 

Db 


1532 
601 


ATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTAT 

I I I I I I M II 1 1 1 II 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 
ATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTAT 


1591 
660 


Qy 

Db 


1592 
661 


GTAGCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCG 

, , , , , , i i i ■ i i i > i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I I I 1 1 1 II 1 1 1 1 1 1 II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTAGCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCGCTGGATGAGCTGCCGCCG 


1651 
720 


Qy 

Db 


1652 
721 


GCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGAT 
, , , i • ■ i i ■ i i i i i i i i i i i i i i i i i i i i i i i i i i r i i i i i i i i i i 

I | | M I I I 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGAT 


1711 
780 


Qy 


1712 


AC CATT GACAAC GCGGC CT GCGGCT GGAT CCAGTT CAT GT CCAAGGT GAGC GT GGACAT C 

1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 M 1 1 II 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 

ACCATTGACAACGCGGCCT GCGGCT GGAT CCAGTTCATGTCCNNNNNNNNNNNNNNNNNN 


1771 


Db 


781 


840 


Qy 


1772 


TTCAAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAG 


1831 


Db 


841 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


900 


Qy 


1832 


GACAACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCG 


1891 


Db 


901 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


960 


Qy 


1892 


C C T C AC GT G C AC T AC AAG AT C C G C C AG AAC T C C AG C T T C AC C G AG AAAAC C AAC GAG AT C 

■ i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i 
1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 

NNNNNNNNNNNNNNNNNNATCCGCCANNACTCCANNTTCACCGNNNAAACCAACGAGATC 


1951 


Db 


961 


1020 


Qy 


1952 


CGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGC 
| | | | | I 1 1 II 1 II 1 1 1 1 1 M 1 1 1 1 II II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGC 


2011 


Db 


1021 


1080 


Qy 


2012 


T T C GT CT GGAT C C AGGAC AT GAT GGAG C G C GC C AT CAT C G AC ACT T T T GT G G G GC AC GAC 


2071 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



1081 T T C GT CT GGAT C C AG GACAT GAT GGAGC GC GC C AT CAT C GACACT T T T GT GG G GC AC GAC 1140 

2 072 GTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGAC 2131 

I I I I I I I I I I I I I I I I II I I I I I I I I I 1 I M I I I I II I I II I I I I I I I II II I I I I I I I I 
1141 GTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGAC 12 00 

2132 TTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCC 2191 

II | I | | | I II I I I I I I II I I I I I II I 1 I I 1 I II I I I I I I I I I I M I I I I I I I HI 

1201 TTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCC 1260 

2192 GT G G C CAT GAC CAT C C AG C AC AT C GT G G C G GAGAAG G AG C AC C G G C T C AAG GAG G T GAT G 2251 

I I M I I I II 1 I II I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I M I I I I I I I I I I I II I 

1261 GT GGC CAT GAC CAT C C AG C AC AT C GT GGCGGAGAAG GAG C AC C GGC T C AAGGAGGT GAT G 1320 

2252 AAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTG 2 311 

| | | | | | | I I II I I I I I I I I It I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I 

1321 AAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTG 138 0 

2312 CAGCT GT CCAT CT CC GT GACAGCACT C ACC GC CAT CCT GAAGT AC GGC CAGGT GCT T AT G 2371 

I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I 

1381 CAGCTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATG 1440 

2372 CACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATG 2431 

I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
1441 CACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCCGTCTACGCGGTGGCCACCATCATG 1500 

2432 TTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGC 24 91 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 TNNNNCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGC 1560 

2492 ATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCG 2551 

I I I I M I I I I I I I I I 11 I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I ! I M I I I I II I 

1561 AT CAT CT ACTT CCT GAGCT AC GT G C C CT AC AT GT AC GT GG C GAT C C GAGAG GAGGT GGC G 1620 

2552 CAT GAT AAG AT C AC G G C C T T C G AG AAGT G CAT CGCGTCCCT CAT G T C C AC GAC G G C C T T T 2611 

M I I I I I I I I M I I I I I I I I I I I I I I II I I I 

1621 CATGATANGNTCACGGCCTTNNNNNNNNNNNNNNNNTCCCTCATGTCCACGACGGCCTTT 1680 

2 612 GGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCAC 2671 

I ! I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I M I I I ! I I II II 1 I I I I I I I I II I I I I 

1681 GGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCAC 174 0 

2 672 AC CT T CAG C C AGT C C C C GGT G GAG GGG GAC GACT T C AACT TGCTCCTGGCTGT C AC CAT G 2731 

I I I I I I II I I I I I I I I I I I I I I I I I I IN I I I I 

1741 ACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCCGTCACCATG 1800 

2732 CT GAT GGT GGAC G C C GT G GT CT AT GG C AT CCT C AC GT G GT AC AT T GAGGCT GT G C AC C C A 2791 
I I I I I I I I M I I I I 

1801 CTGATGGTGGACGCNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 18 60 
27 92 GGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGC 2851 
1861 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1920 
2852 AGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGT 2911 
1921 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 198 0 



2912 GTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGC 2971 

I I I I I I I I I I I I I I 

1981 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGGAGACCCGTGGC 204 0 

2972 ATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTC 3031 

M I I I M I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I 

2041 ATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTC 2100 

3032 T AC AAG G AC G AC AAG AAG CTGGCCCT G AAC AAG C T GAG C C T G AAC C T C T AC G AG AAC C AG 3091 

I | I I I I I I II I I I I I I I I I I II I I I I I I I II II I I I II M I I I I I I I M I I I I I I 

2101 T AC AAG GAC GACAAGAAG CT G G C C CT GAAC AAG CT GAGC CT GAAC CT CT ACGAGAAC C AG 2160 

3 0 92 GTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACC 3151 

I I I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I I I I I I I I I 

2161 GTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCNNNNNNNNNNNNNNNTCCATCCTGACC 2220 

3152 GGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAG 3211 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 GGCCTGTTCCCTCCAACGTCGGGTTCNGCCACCATCTACGGGCACGACATCCGCACGNNN 22 8 0 

3212 AT GGAT GAGAT C C GCAAGAAC CT GG GCAT GT GC C C GCAG CACAAT GT G CT CT TT G AC C G G 3271 
I I II I I I I I I I I I I I 

22 81 NN GGAT GAGAT C C GCAANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 234 0 

3272 CTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGAG 3331 

2341 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 2400 

3332 AT C C GCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT CCAACAAACGGCACT CA 3391 

2401 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 2460 

3392 CTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTG 34 51 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
24 61 NNNNNNNNNNNNNNNTCGGGTGGCATNAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTG 2520 

3452 GGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGC 3511 

ill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

2521 GGCGGCTCTCNNNCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTNNNNNNNN 2 58 0 

3512 CG CG C CAT CT G GGAC CT CAT C CT GAAGT AC AAGC CAGGC CGCACCAT CCTTCTGTC C AC C 3571 

I I I I I I I I II I I I I I I I I I I I I I 
2581 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCCGCACCATCCTTCTGTCCACC 2 640 

3572 C AC CAC AT GG AT GAGGCT GAC CT GCT T GGG GACC GCAT T GC CAT CAT CT C C CAT GG GAAG 3631 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

2641 CAC CAC AT GGAT GAGGCT GACCTGCTTGGGGACCGC ATT GCC AT CAT CTCCCATGGGAAG 27 00 
3632 CTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTC 3 691 

I | | | | | M I I II II I I I I I I I I I I I I I I I I I I I I I I I M I I II I M M I I I II I M I I I I 

2701 CTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTC 2760 

3692 ACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGC 3751 

| | | | | | | | I || I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I II I I I I 
2761 ACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGC 282 0 



Qy 


3752 


CCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGC 
| | | | | | | | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCCLLAGGx LLGLLLLLLL 1 LALLALL i 1 LLLAoL 1 LLrVaLl ol L>LLrvj± l ^/AJ. v_^\j^ 


3811 


Db 


2821 


2880 


Qy 

Db 


3812 
2881 


AAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTG 

| | | | | | | | | I I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AAGCATGTGGlCTCCxGlL 1 GL I LLl L 1 LALALALAftLLALLLALLl l 1 luialai ll i o 


3871 
294 0 


Qy 


3872 


CCCAGCGAGGCCGLLAAGAAbLLLLLl 1 1 LLALLLLLl LI 1 LLAbLALU 1 bb/\bLuL/\kj^ 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 

CCCAGCGAGGllGllAAGAAGGGGGL 1 1 1 LLALLLLLl LI 1 LLALrsirsllNiNrYiNiNiNiNiNiNiNiNiNJ.N 


3931 


Db 


2941 


3000 


Qy 


3932 


CTGGATGCACT GlAlLI LALLAlL 1 1 LbbbLl bAl bbALALbALLLl bbAbbHAbl bl IL 


O -? _7 J. 


Db 


3001 


XTXTXTXTXTXTXTXTXTXT\T\TXTTaXTX.TXT\T\T\T\TM 

NNNNNNNNNNNNNNNNN N NJNIJnNJnNJNIINNNJnJNINJNNJN 




Qy 


3992 


CTCAAGGTGTCGGAGGAGGAI LAG 1 LGL 1 bbAbAAbAbl bAbbLbb/\l L 1 bAAbbnbibb 


4 f)S1 


Db 


3061 


NNNNNNNNNNNNNNNNNNNNNNNNN^ 


"31 9fl 
O X Z U 


Qy 


4052 


AGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGlGTLI GGGGAGGLl LALLL1 LLLAA1 


4111 

4 X X X 


Db 


3121 


xtxtx y»t>tw>txT»TXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXT\TX^ 

NNNNNNNNNNNNNNNNNNNNNN^ 


qi on 

OlOU 


Qy 


4112 


CTGGCCCGGTGCTCGGAGCTGACCCAG1 LGLALLLAl LbbibLAbiLbbLbJ. LAiuibib 


4171 


Db 


3181 


NNNNNNNNNNNNNNNNNNNNNNNN^ 


"394 0 

JAl u 


Qy 


4172 


GGCTCTGCCCGTGGCGACGAGGGAGCTGGCTAlAllGALGI L I Al llLLALI ALLLLLLL 


4 9^1 

4 £. O X 


Db 


3241 


« txt>t>t>txt>TXT1lTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXT\TXTXTXTXTXTXT^ 

NNNNNNNNNNNNNNNNNNNNNNN 


O O VJ VJ 


Qy 


4232 


C T C T T T GAT AAC C L AL AG L AL L L AG AL AA i L 1 L Ab L L 1 L L AAL AL L l L L/\L L L.H.L.ttLr^^^ 


49 91 


Db 


3301 


■» t-» t-» tvtxtt^xtxtxtxtxtxtxtxtxTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTKTXTXTXTKTXTXT 'KTXTNT'KT'NT'KT'M'KT'M'M'MTvT'M^J'MMMTvTMMMM 

NNNNNNNNNNNNNNNNNNNNNNN 


O O v) VJ 


Qy 


4292 


CTGTCGAGGGTCGGCCAGGGlAGllGLAAlLI LLALLLLLLL1 LLL1 LAALL1 LLLLL/\L 


4 ^ SI 


Db 


3361 


■»ti txt»txt*tXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXT\TXTXT^ 

NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN N NNWNNJNNJNlNJNiNJNNJNiNi^ 


^4 9 n 


Qy 


4352 


TTCCACGGGCTGCTGGT CAAALlL 1 1 LLAL1 LLLLLLLLLLLAAL 1 LLAAbbbAbl LI 1^ 


4411 


Db 


3421 


NNNNNNNNNNNNNNNNNNNNN N IN N N N N N JN N iN IsJ JN JN JN JN JN IN 


3480 


Qy 


4412 


TCCCAGATlTTGCTGLLAGLL 1 1 L 1 1 LL1 L 1 bbblbbLLAl LALLL1 LLLLL 1 LI ULijl ^ 


4 4 71 


Db 


3481 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNlNlN 


0 


Qy 


4472 


CCGGAGATTGGTGATlTGllllCGLIGGILLI bl LALL1 1 LLLAL 1 ALbALAAb i /al/all 


4 S^l 


Db 


3541 


xtt^xtxt*txTXTXTxtxtxTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTXTKTXT\TXT\T^ 

NNNNNNNNNNNNNNNNNNNNNNNNNNNNNlNiNNNNr^NNN 




Qy 


4532 


CAGCCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGG 


4591 


Db 


3601 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3660 


Qy 


4592 


CTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTG 


4651 



Db 


3661 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3720 


Qy 


4652 


GGT GC C AC CT GC GT GCT CAAGT CT C C C G C CAAC GGCTCGCTGGGGCC C AC GT T GAAC CT G 


4711 


Db 


3721 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3780 


Qy 


4712 


AGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCC 


4771 


Db 


3781 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3840 


Qy 


4772 


TTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCT 


4831 


Db 


3841 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3900 


Qy 


4832 


GACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACC 


4891 


Db 


3901 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3960 


Qy 


4892 


GCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTC 


4951 


Db 


3961 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


4020 


Qy 


4952 


CGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCAC 

i i i i i i i i i i i i i i i i i i i i i i i i i i I I I I I l l l l 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

NNNNNNNNNNNNNNNNNNNNNNNNNCCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCAC 


5011 


Db 


4021 


4080 


Qy 

Db 


5012 
4081 


CC GC C CCAGAT G C GGGT GGT C ACAG G C GACAT C CT GAC CGAC AT C AC C GGCC ACAAT GT C 

i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I I 
I I I I I I I I I I I 1 1 1 1 1 1 1 II II II 1 II II 1! II II 1 II II II 1 II II M 1 II II II II II 

CC G C C C CAGAT GCGGGTGGT CACAGGCGAC AT C CT GAC C GACAT C AC C GG CC AC AAT GT C 


5071 
4140 


Qy 

Db 


5072 
4141 


TCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACC 

i i i i i i i i i i i i i i i i i i i i i i i I I I I I 1 l I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 

TCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACC 


5131 
4200 


Qy 
Db 


5132 
4201 


TTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTG 

1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTG 


5191 
4260 


Qy 


5192 


CGGAAGATCGCGGT GCGCAGGGCT GCCCAG 5221 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CGGAAGATCGCGGTGCGCAGGGCTGCCCAG 42 90 




Db 


4261 
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Location/Qualifiers 

1. .5743 

/organism="Mus musculus" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 10090" 
<1. .>5743 
/gene="ABCA2" 
/locus tag="HCM7606" 



ORIGIN 



Query Match 29.2%; 
Best Local Similarity 51.5%; 
Matches 3083; Conservative 



Score 2347.4; DB 29; Length 5743; 
Pred. No. 0; 
0; Mismatches 2539; Indels 369; Gaps 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



101 TGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTG 

| | | | I I I I I I I II I I I I I I I I I I I I I I II M M I I I I I M I II I MM III 
1 TGGGTCCTGGCTTTTGAGATCTTCATCCCGCTTGTCCTCTTCTTCATCCTGTTGGGACTG 

161 CGACAGAAGAAGCCCACCATCTCCGTG/^AGGAAGTCCCCTTCTACACAGCGGCGCCCCTG 

|| | | M I I II M I I I II I M II M II I I I I I I I I I II II II M M M III 

61 C GGCAGAAGAAGC C CAC C AT CT CT GT GAAG GAAG CTTTCTACACCGCAGCACCGCTG 

221 ACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAG 

|| | | | | || I I I I I I I I I I I M I I I II Mill II I I I II M I I I M I II III 
118 ACATCAGCCGGCATCCTGCCCGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAG 



6; 



160 



60 



220 



117 



280 



177 



2 81 TTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGC 34 0 

I M II M II I I I I I M II II 

178 TTTGGCTTCCTGCAATATGCCAACTCCACNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 237 

341 GTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAG 4 00 

238 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 2 97 

401 GCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTG 4 60 

2 98 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 357 



Qy 



4 61 GACAGAT C CAC AGT GTCTTCCTTCTCTCTG GACT CG GT G G C CAGAAAC C C G C AG GAGC T C 520 



Db 


358 


NNNNNNNNNNNNNTTTCATCCTTCTCTCTGGACTCGGTGGCCAGGGACCAGAGAGAGCTT 


417 


Qy 


521 


TGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCC 

i i i i 1 1 1 1 1 I 1 1 1 III Mi 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 III 1 II 

| | | I 1 1 1 1 1 1 1 1 1 III Ml 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 Ml I li 
TGGCGTTTCCTGATGCAGAACCTGTCACTGCCCAACAGCACGGCCCAAGCCCTCCTAGCT 


580 


Db 


418 


477 


Qy 


581 


GCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGAT 

t i i i i i i i i i i i i i i i I I I 
1 I I 1 II 1 1 1 II 1 1 1 1 1 1 1 1 

GCCCGTGTGGACCCTTCCGAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


640 


Db 


478 


537 


Qy 


641 


TCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTG 


700 


Db 


538 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


597 


Qy 


701 


TTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCG 

i i i i i i i i i i i i i i i i I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 II 1 II 
1 || 1 1 1 I 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 

NNNNNNNNNNNNGAGCTGCTGCTGGCTCCTGCCCTTTTGGAACAGCTCACATGTGCTCCA 


760 


Db 


598 


657 


Qy 


761 


GGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAG 

ii ii i i i i i i i i i i i i i i i i it ii i i i i i i i i i I I I mi ll III III 
|| || 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 III II Ml III 

GGTTCTGGGGAACTGGGCCGGATTCTTACCATGCCTGAGGGTCATCAGGTAGACCTTCAG 


820 


Db 


658 


717 


Qy 

Db 


821 
718 


GGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGG 

■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ii I I I I I l l l l l l l l 1 
I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGCTACCGGGATGCTGTGTGCAGTGGGCAGGCTACAGCTCGTGCCCAGCGCTTCAGCGAT 


880 
777 


Qy 


881 


CTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTG 

ii i i i i i i i i t i i i i \ i i i i i i i i i i i i i i i i i I I I I I I I I t I I 1 1 I 
M | I 1 I II 1 1 1 1 1 1 1 1! I 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 M 1 1 1 1 I 1 1 1 1 1 

TTGGCCGCTGAGCTCAGGAACCAGCTGGACACAGCCAAGATTGCTCAGCAGCTGGGCTTC 


940 


Db 


778 


837 


Qy 

Db 


941 
838 


GATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCG 

i i i i i i i i i i i i i i i i it ii i i i I I I I I I II 1 1 1 1 1 1 III 1 1 1 1 III 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 III 1 1 1 1 IN 

GATGTCCCCAACGGCTCAGATCCCCAGCCACAGGCACCGTCCCCACAGAGCCTGCCGGCA 


1000 
897 


Qy 

Db 


1001 
898 


CTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCC 

ii i i i i i i i i i i i i i i i i i i i i i i i i I I l l l l l l l l l l l 1 1 I 1 1 1 1 1 1 II III 
|| I 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II III 

CTCTTAGGGGACCTGCTGGATGCCCAGAAACTTCTGCAGGATGTGGATGTCCTATCAGCC 


1060 
957 


Qy 


1061 


CTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGT 

ii I I I l I I 1 1 1 1 1 1 1 II 1 I 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 III 1 1 1 1 1 1 1 
|| 1 1 1 1 1 1 1 1 1 1 1 1 1 II I I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 Ml 1 1 1 1 1 I 1 

CTTGCCCTGCTGCTGCCTCAAGGTGCCTGTGCTGGCCAGGCCTCTGCACCTCAAGCCAGC 


1120 


Db 


958 


1017 


Qy 


1121 


GGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACC 

i i iii i i i i i i i i i i mi mi mi II 1 I 1 1 1 1 1 1 1 
I | III 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 1 1 II I'll' MM 

AGC CT GAAT GG C CT G GC CAACAG C AC CG GGAT AG GT GC AAAT T CAGGT T C CAAC AC C ACT 


1180 


Db 


1018 


1077 


Qy 


1181 


GCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAG 

i i i i 1 1 1 1 II III 1 III 1 II Mill 1 1 II 1 II III 

I | || | || II 1 1 1 1 M Ml 1 III 1 II 1 1 II 1 1 1 1 1 1 M mi 

GTTGAGGAGGGCACCCAGTCACCTGTCAGCCCAGCCTCTCCTGACACTCTGCAAGGGCAG 


1240 


Db 


1078 


1137 


Qy 


1241 


TGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGC 

1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M III 1 1 1 1 II 1 II 1 1 II 1 1 1 II 1 II 1 II 1 1 1 
TGCTCAGCCTTTGTGCAGCTCTGGGCTGGCTTGCAACCCATCTTGTGTGGCAACAACCGN 


1300 


Db 


1138 


1197 


Qy 


1301 


ACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAG 


1360 



1198 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1257 

1361 GAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTAC 142 0 

1258 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1317 

1421 GCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTT 14 8 0 

II II I I I II I I I I I M I 
1318 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCAAAT GAGACCTTTGCCTTT 1377 

1481 GTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGC 154 0 

I I I I I I I I I I I || II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I 
1378 GTGGGCAACGTTACACACTACGCCCAGGTCTGGCTCAACATCTCCACAGAGATCCGAAGC 1437 

1541 TTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAG 1600 

I I I I I I I I I I I I I I I I I I I I I II I II I M I III I I I I I I I I I I I I I I I M 
1438 TTCTTGGAGCAAGGCAGGCTGCAGCAGCATCTGCAGTGGTTACAGCAGTATGTAGCTGAT 14 97 

1601 CTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGA 1660 

|| | Ml | I I I I II III I I 1 I I I I I M Mill I I I I II I I II II Ml I 
14 98 CTTCAGCTACACCCTGAAGCAATGAACCTGTCCCTGGAGGAGCTGCCACCTGCTCTGCGC 1557 

1661 CAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGAC 1720 

I I I I I I I I II I I I I I I I I I I II I I I I I I I M I I I II I I II II II Ml 
1558 CAGG AC TT CT C AC T G C CT AAT G G C AC AGC CCT C CT GCAACAG CT T GACACAAT AGAC 1614 

1721 AACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGC 178 0 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I 
1615 AACGCAGCCTGTGGCTGGATCCAGTTCATGTCCAA GNNNNNNNNNNNNNNNNN 1667 

1781 T T C C C C G AC GAG GAG AG CAT T GT C AACT AC AC CCT C AAC C AG G C CT AC C AG G AC AAC GT C 1840 
1668 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1727 

1841 ACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTG 1900 

I I I I I I I I I I I I I I I I I I I I I II II I I I II I I M 
1728 NNNNNNNNNNNNNNNNNNNNCTTCCAGACACGGAAGGACGGCTCCCTCCCTCCACATGTA 17 87 

19 01 C AC T AC AAG AT C C G C C AGAAC T C C AG C T T C AC C G AG AAAAC C AAC GAG AT CCGCCGCGCC 1960 

|| M I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 
1788 CAT T ACAAGAT T C GC CAGAAT T CAAG C T T C ACT GAGAAAAC CAAT GAGAT C C GC C GT GCT 1847 

1961 TACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGG 2020 

|| Mill II I I I I I II I II II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
184 8 TATTGGCGTCCAGGGCCCAACACCGGTGGTCGCTTCTACTTCCTCTATGGCTTCGTCTGG 1907 

2 02 1 AT C CAG GAC AT GAT G GAGC GC GC CAT C AT CGAC ACT T T T GT GGG G C AC GAC GT GGT G GAG 2080 

| | I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
190 8 AT C CAG GAC AT GAT G GAG C GC G C CAT CAT C AAC AC AT TTGTGGGG CAT GAC GT G G T C GAA 1967 

2 081 CCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTT 214 0 

|| | I I I I I I I I I I I I I I I I I I II I I II I I I I I I M M I I I I I I I I II I I 

1968 CCTGGCAACTACGTGCAGATGTTCCCATACCCCTGCTACACCCGTGACGACTTCCTGTTT 2 027 

2141 GTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATG 2200 

| | | I II I I I I I I I I I I I I I I I I II II I I II I I I I I I M I I I I I I I I I I I I I I I I I I 
202 8 GT CAT T GAACACATGAT GC CATT GT GCAT GGT GATCTCCT GGGT CT ACT CT GT GGC CAT G 2087 



Qy 2201 ACCAT CCAGCACATCGT GGCGGAGAAGGAGCACCGGCTCAAGGAGGT GATGAAGACCAT G 22 60 

M I I I II I I I I II I I I M II I I I I I I I I I I I I I I I I I I I I M Ml 

Db 2088 AC CAT C C AGCAT ATT GT GGCAGAGAAAGAGCACAGGCT CAAGGAGGT GAT GAAGAC GAT G 2147 

Qy 2261 GGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCC 232 0 

I I M II II II I I I I I I I I I I I I I I I I I I I I I I I M I I M I I I I I I I 

Db 2148 GGCCTGAACAACGCCGTGCACTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCT 2207 

Qy 2321 AT C T C C G T G AC AG C AC T C AC C G C CAT C C T G AAGT AC G G C C AG G T G C T TAT G C AC AG C C AC 2380 

I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2208 ATCTCCGTGACAGCTCTGACCGCCATCCTCAAGTACGGCCAGGTGCTCATGCACAGCCAC 2267 

Qy 2381 GTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTC 244 0 

Ml | | I I I I I I I I I I II I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2268 GTGCTCATTATCTGGCTCTTCCTTGCCGTCTACGCTGTGGCCACTATCATGTTTTGCTTC 2327 

Qy 2441 CTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTAC 2500 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I Mill II II I I I I I I I I I 
Db 2328 CTGGTGTCTGTGCTGTACTCTAAGGCTAAGTTGGCCTCAGCCTGTGGCGGTATCATCTAC 2387 

Q y 2501 T T C CT GAGCT AC GT G C C CT AC AT GT AC GT G G C GAT C C G AGAG GAG GT GG C GC AT G AT AAG 2 560 

I I I I I I I I I I ! I I I I I I I I I II I I I II I I I I I I I I I I I I I I M II I I I I I III 

Db 238 8 T T C CT GAGCT AC GT T C C C T ACAT GT AT GT AGC GAT C C G C GAGGAGGT AGCC CAT GACAAG 2447 

Qy 2561 ATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGC 2 620 

I I I I I MIM II II II I I I I II I II I I II I I I I I I I I I I I I I 

Db 244 8 ATCACTGCCTTCGAGAAGTGCATTGCGTCCCTGATGTCCACAACAGCCTTTGGCCTGGGT 2507 

Qy 2621 TCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGC 2 68 0 

|| | | I I I I I I M II I I II I I I M M M I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 2508 TCCAAGTACTTTGCACTGTATGAAGTGGCAGGAGTGGGCATCCAGTGGCACACGTTCAGC 2567 

Qy 2681 CAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTG 2740 

M I I I I I I I I I I I I I I I I I II I I M I I I II II I I I I II I I I M I I I 

Db 2568 CAGT C C C CAGT GGAAGGAGAT GAC T T C AAT CT GCT C CT T G CT GT CAC CAT GC T T AT GGT G 2 627 

Qy 2741 GACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTAC 2800 

I I I | I I I I I I II III I II I I I I I I M I I I I I I II I I I I I I M I I I 
Db 2628 GACACGGTGGTCTACGGCGTGCTCACTTGGTACATTGAGGCTGTGCACCCA 267 8 

Qy 2 8 01 GGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGG 2 8 60 

Db 2679 2678 

Qy 2 8 61 ACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAG 2920 

Db 2679 2678 

Qy 2921 GAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAG 2980 

I I I I I I I I I I I I II II I II I I I I I II I I II I I I I I I I I II I I I I I I I I I I I I I I 
Db 2679 GAC C A G GCCTGTGC CAT G GAG AG C C G G CAC T T C GAG GAG AC C C G C G G CAT G GAG GAG 2735 

Qy 2981 GAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGAC 3040 

I || I I I I || I I I I I I II M I I I I M I I I M I I M II I I I II I I I I I II M I I 
Db 2736 GAGCCCACCCACCTGCCCTTGGTCGTCTGTGTGGACAAGCTCACCAAGGTCTATAAGAAT 2795 



Qy 3041 GAC AAGAAG C T GGC CCT GAACAAG CT GAG C CT GAAC CT CT ACGAGAAC C AG GTGGTCTCC 3100 

ii 1 1 1 ii 1 1 inn i mil I I I I I I I I II M ii I I I I I I I M I I I I I I I 

Db 27 96 GACAAGAAGATGGCCTTAAACAAACT GAGCCTCAATCT GTATGAGAATCAGGT GGTCTCT 2 855 

Qy 3101 TTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTC 3160 

Ml I I II I I I II I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I II I I I I I I 
Db 2856 T T C CT AG GC CACAAC GG GGC C G GCAAG AC C AC GAC CAT GT C GAT CCT GACT G GAC T GT T C 2915 

Qy 3161 CCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATGGATGAG 3220 

|| || I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I II I II I I I I I I I I I 
Db 2916 C C AC C C AC GTCGGGCT C AG C C ACT AT C TAT G G G C AC GAC AT C C G C AC C G AGAT G GAT GAG 2 975 

Qy 3221 ATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTG 32 80 

I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2976 AT C C G CAAGAAC CT G GGCAT GT GC C C 3001 

Qy 3281 GAG GAAC AC C T C T G GT T CT AC T C AC G G CT CAAGAGC AT GGCT C AGGAG GAGAT C C GC AGA 3340 

Db 3002 3001 

Qy 3341 GAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT CCAACAAAC GGCACT CACT GGT GCAG 3400 

I I I I I I I I I I I I I I I I I I 

Db 3002 C GGCACT CACT GGT GCAG 3019 

Qy 34 01 ACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCT 34 60 

|| | | | I I II I I I I I I I II I I I I II INN I II I I I II I I I I I I I I 

Db 302 0 ACGTTGTCTGGAGGCATGAAGCGCAAGCTTTCGGTAGCCATTGCCTTTGTGGGTGGCTCT 3079 

Qy 34 61 CGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATC 3520 

I I I I I I II I I I I I I I I I I II I I I II I II I I I I I I I I I I I 

Db 3080 AGAGCCATTATCTTAGACGAGCCCACGGCTGGCGTGGACCCCTATGCTCGCCGTGCCATC 3139 

Qy 3521 T G G GAC C T CAT CCT GAAGT AC AAG C C AG G C C GC AC CAT CCTTCTGTC C AC C C AC C AC AT G 358 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M MINI 

Db 314 0 TGGGACCTCATTCTGAAGTACAAGCCGGGCCGCACTATCCTCCTGTCTACCCATCACATG 3199 

Qy 3581 GAT G AGGCT GAC CT GCT T GGG GAC CG CAT T G CC AT CAT CT C C C AT GG GAAGCT C AAGT GC 3640 

| | | | | || | | | | | M I I I I I I II I I I I I I I I II I I I I M I I I M I I I I I I I I I I I Ml 
Db 3200 GATGAGGCTGACCTGCTGGGGGATCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGC 3259 

Qy 3641 TGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTC 37 00 

II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 32 60 TGTGGCTCTCCCCTCTTCCTCAAGGGAGCCTATGGCGATGGGTACCGCCTCACATTGGTC 3319 

Qy 37 01 AAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGT 3760 

I I I I I I I II II I I I I I I I II i 1 II I I I I I I I I | I I I I I I I I I I I 

Db 3320 AAGCAGCCTGCAGAACCTGGCACCTCCCAAGAGCCAGGGCTGGCTTCCAGCCCCTCAGGT 3379 

Qy 3761 CGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTG 3820 

| I I I I I I I II I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3380 T GT C CT C GG CT GAGCAGCT GC T C GGAGC CGCAAGT GT C CC AGT T CAT C C GCAAGC AT GT G 3439 

Qy 3821 GCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAG 3880 

II MM I I I II I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 3440 GCTTCCTCCCTGCTGGTCTCAGACACGAGCACCGAGCTCTCCTACATCCTGCCCAGCGAG 3499 

Qy 38 81 GCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCA 394 0 



Db 


3500 


GCCGTCAAGAAGGGGGCCTTCGAGCGCCTCTTTCAGCAACTGGAACACAGCCTGGATGCG 


3559 


Qy 


3941 


CTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTG 


4000 


Db 


3560 


II II II 


3567 


Qy 


4001 


T CGGAGGAGGAT C AGT CGCT GGAGAACAGT GAGGC CGAT GT GAAGGAGT CCAGGAAGGAT 

l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 
1 1! 1 1 1 1 1 1 1 1 1 1 1 1 M ll I I M 


4060 


Db 


3568 


3591 


Qy 


4061 


GTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGG 

1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 III II 1 1 1 1 1 1 1 1 1 II 1 1 1 Mill 1 II 

1 1 1 1 1 II 1 1 1 1 1 1 II 1 II 1 1 1 1 IN II 1 1 1 1 1 1 MINIM 1 1 II 1 Ml 
GTGCTGCCTGGGGCAGAGGGCCTGACAGCTGTGGGGGGTCAAGCTGGCAACCTGGCTCGG 


4120 


Db 


3592 


3651 


Qy 

Db 


4121 
3652 


TGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCC 

■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ii ii i i i M I ll I I I ll ll 
| | I I I I II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M M 1 M 1 II 1 M M M M 

TGCTCAGAGCTGGCACAGTCACAGGCATCGCTGCAGTCTGCATCCTCTGTGGGCTCTGCC 


4180 
3711 


Qy 


4181 


CGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGAT 

t i i i i i i i i i i i i ii i iii ii i i i i i i i i i i i i i i i i i M 

1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 II 1 III II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

CGTGGGGAGGAGGGCACCGGCTACTCTGATGGCTACGGTGACTACCGTCCCCTCTTTGAC 


4240 


Db 


3712 


3771 


Qy 


4241 


AACC CACAGGAC C CAGACAAT GT CAGC CT GCAAGAGGT GGAGGC AGAG GC C CT GT C GAGG 

iii i i i i i i i i i i i i i i i i i i i i i i i i i i 
1 I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 

AACTTGCAGGACCCAGACAATGTCAGCTTACAAGNNNNNNNNNNNNNNNNNNNNNNNNNN 


4300 


Db 


3772 


3831 


Qy 


4301 


GTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGG 


4360 


Db 


3832 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3891 


Qy 


4361 


CTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATC 


4420 


Db 


3892 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


3951 


Qy 


4421 


TTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATT 


4480 


Db 


3952 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


4011 


Qy 


4481 


GGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGT 


4540 


Db 


4012 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


4071 


Qy 


4541 


GGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCC 


4600 


Db 


4072 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


4131 


Qy 


4601 


GACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACC 


4660 


Db 


4132 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


4191 


Qy 


4661 


TGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGG 


4720 


Db 


4192 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 


4251 


Qy 


4721 


GAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAG 


4780 



4252 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 311 
47 81 GGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCA 4 84 0 
4 312 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 371 
4 841 GCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCA 4 900 
4372 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 44 31 

4901 GAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACC 4 960 

I I I II I I I II II I I I I I I I I II Ml HI 

4432 NAGACGTGGACGTCGGCGCCTTCTCTGCCACGCCTAGTGCATGAGCCAGTCCGCTGTACC 44 91 

4 961 TGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAG 502 0 

IMMIM I I I I I I I I I I Mill II I I I II I I I II I II M II II I I I II I II I 
4 4 92 TGCTCTGCACAGGGCACGGGGTTCTCATGCCCCAGCAGTGTGGGTGGACACCCACCCCAG 4 551 

5021 AT GCGGGT GGT CACAGGC GAC AT CCT GACCGAC AT CAC CGGCCAC AAT GT CT CT GAGT AC 508 0 

M I I I I II I I I M I I I I I I I II II M M I I I I II I II I II I II M I I I I 

4552 AT GAG AGT G GT CAC AG GT GAC AT C CT GACT GAC AT CACT G GC C ACAAT GTT T C T GAGT AC 4 611 

5081 CTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAAC 5140 

I I I I I M I II I II I Mill IMMIM Mill II I 

4612 CTGCTCTTCACCTCTGACCGTTTCCGACTACACCGATATGGAGCCATCACCTTTGGTAAT 4 671 

5141 GT C CT GAAGT C CAT C C C AGC CT CAT T T G GC AC C AG G GC C C CAC C CAT G GT G C G GAAGAT C 52 00 

|| | | || || I I II II I II II II M I I M II II II I M 

4672 GTTCAGAAGTCTATCCCAGCATCCTTTGGTGCCCGGGTCCCTCCTATGGTGCGGAAGATT 4731 

52 01 GCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACT^ACAAGGGCTATCACAGCATGCCCACC 5260 

I I I M M M M M I M 

4732 GCAGTGCGGAGGGTGGCT CAGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 47 91 
52 61 TACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAAC 5320 

47 92 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 48 51 
5321 CCGGCGGCT T AC G G CAT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC CAGC G C C AG C CT C 538 0 

48 52 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 911 
5381 TCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCC 5440 
4912 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4 971 
5441 ATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCC 5500 
4972 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5031 
5501 AAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTG 5560 
5032 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5091 
5561 TGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTC 5620 
5092 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5151 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



5621 GACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTC 568 0 

5152 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5211 

5681 TATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGC 5740 

5212 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5271 

5741 TCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCC 5800 

5272 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5331 

58 01 ACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTG 5860 

5332 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5391 

5861 AAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCC 5920 

53 92 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5451 

5921 T ACAAC GAGT ACAT C AACGAGTACT AC GCCAAGATT GGCCAGTTT GACAAGAT GAAGT C C 59 8 0 

5452 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5511 

5981 CCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTG 6040 

5512 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5571 

6041 GGCTTCCTCCT GAC CAT CAT GT G C C AGT AC AACT TCCTGCGGCGGC C AC AG 6091 

I 

5572 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNG 5622 
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This clone has the following problem: no polyA-tail . 
Location/Qualifiers 
1. .2065 

/organism="Homo sapiens" 
/mol_type= M mRNA n 
/db_xref="taxon: 9606" 
/ clone=' 1 IMAGE : 5179755" 

/tissue_type="Brain, Lung, Testis, adult, pooled whole" 
/clone_lib="NIH__MGC__115" 
/lab_host= M DH10B" 
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ORIGIN 



Query Match 23.7%; Score 1903.4; DB 11; Length 2065; 

Best Local Similarity 96.3%; Pred. No. 7.2e-285; 

Matches 1989; Conservative 0; Mismatches 1; Indels 75; Gaps 



1; 



4 CGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGCT 63 

| | | | | | | | I I I I I I I I I I I I I I M I I I I I I I I 1 I I I I I I I I I I I II I I I I II I I I I I I I I 
1 CGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGCT 60 

64 GCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCTT 123 

I | | | | | | | | I I I I I II I I I I II I II I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

61 GCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCTT 12 0 

124 CATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCTC 183 

| | | | | I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 CATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCTC 180 

184 CGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTGT 243 

| | | I I I I 1 I I I I I | | I I I I II I II I I I I II I I I I I I I I I I M II I I I I I I I I I I I I I I I 
181 CGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTGT 24 0 

24 4 CATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCAA 3 03 

I M I I I II I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

241 CATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCAA 300 

304 CTCCAC 309 

I I I I I I 

301 CTCCACGTGAGTGCCCACCCGCCCCTCGGAGCACCCACCCCTCCCCAGCCCATCCAGTGA 360 

310 GGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGA 348 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
361 GTGACATCCGCCATGGTGCAGGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGA 420 

349 GGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACG 4 08 

I I I I I I I I I I I I I I I M I I I I II I II I II I I I M I I I I I I I I I I I I II I I I I I II I I I I I 

421 GGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACG 4 80 

409 CCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATC 4 68 

| I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I 
481 CCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATC 540 

4 69 CACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTT 528 

I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

541 CACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTT 600 

52 9 CCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGT 5 88 

M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 CCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGT 660 

58 9 GGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTC 648 

| | | I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I i I I I II I I I I 
661 GGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTC 72 0 

649 TGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGAT 708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 TGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGAT 7 80 

7 09 GGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGG 7 68 

| | | | I I M I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I 
7 81 GGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGG 840 

769 GGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCG 828 



Db 


841 


Qy 


829 


Db 


901 


Qy 


889 


Db 


961 


Qy 


949 


Db 


1021 


Qy 


1009 


Db 


1081 


Qy 


1069 


Db 


1141 


Qy 


1129 


Db 


1201 


Qy 


1189 


Db 


1261 


Qy 


1249 


Db 


1321 


Qy 


1309 


Db 


1381 


Qy 


1369 


Db 


1441 


Qy 


1429 


Db 


1501 


Qy 


1489 


Db 


1561 


Qy 


1549 


Db 


1621 


Qy 


1609 



I I I I I I I M I I I II I I I I I I I I I I I II I I I I I I I I M I I I I I I I I II I I I I I I I I 

GGAGC T G GGC C G GAT CC T C AC T GT GC CT GAGAGT CAGAAG GGAG C C CT G CAG G G CT AC C G 900 

GGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGC 8 8 8 

I | | | | | | | | | | | I I I II I I I I I I I I I II II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
GGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGC 960 

TGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCC 948 

| | | | | | | | | | | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCC 1020 

CAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGG 1008 

I | | | I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I II I I I I I I I I 

CAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGG 1080 

GGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCT 1068 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

GGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCT 114 0 

GCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGG 1128 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
GCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGG 1200 

TGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGA 1188 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 it 1 1 1 iimi 

TGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGA 1260 

GGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGC 124 8 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

GGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGC 1320 

CTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGA 1308 

I I I I I I I II I I I II I I I II I I I I I I I M I I M I I I I I I I I I II I I I I I I 

CTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGA 1380 

ACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCG 1368 

I I I I I I I II I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

ACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCG 1440 
GAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGC 1428 

I I I I I I I I I I I I I II M I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I 

GAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGC 1500 

GGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAA 1488 

I M I I I II II I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I 

GGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAA 1560 

CGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGA 154 8 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 

CGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGA 1 62 0 

GCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCT 1608 

I | | I | | I I || || I II I I I I II I I II I I I I I I I I I II II I I I I M I I I I I I I I I I I I I I I I 
GCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCT 1680 

GCACCCC GAGGCACT GAAC CT GT CACT GGAT GAGCT GC C GCCGGCC CT GAGAC AGGACAA 1668 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 



Db 



1681 GCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAA 174 0 



Qy 1669 CTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGC 1728 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1741 CTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGC 1800 

Qy 1729 CTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGA 1788 

I I I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1801 CTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGA 1860 

Qy 178 9 C GAG GAGAG CAT T GT C AAC TAC AC C CT CAAC CAGG C CT AC C AGGAC AAC GT C ACT GTT T T 1848 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I II I I I I M I 
Db 1861 CGAGGAGAGC ATT GTCAACTACACCCT CAAC CAGGCCTACCAGGACAACGTC ACT GTTTT 1920 

Qy 18 49 TGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAA 1908 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 T G C C AGT GT GAT CT T C C AGAC C C G GAAG GAC GGCT CGCTCCCGCCT C AC GT GC ACT ACAA 1980 

Qy 19 09 GATCCGCCAGAACTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCG 1968 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1981 GAT C C G C C AGAACT C C AG CTT CAC C GAGAAAAC CAAC GAGAT C C GC C GC GCCT ACT GGC G 2 04 0 

Qy 1969 GCCTGGGCCCAATACTGGCGGCCGC 1993 

I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2041 GCCTGGGCCCAATACTGGCGGCCGC 2 065 
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FEATURES Location/Qualifiers 
source 1. .6600 

/organism="Mus mus cuius" 
/mo l_type=" genomic DNA" 
/db__xref="taxon: 10090" 
gene <1. .>6600 

/gene="ABCAl" 
/locus_tag="HCM2235" 

ORIGIN 

Query Match 12.0%; Score 965; DB 29; Length 6600; 

Best Local Similarity 51.1%; Pred. No. 4.1e-139; 

Matches 2766; Conservative 0; Mismatches 2387; Indels 255; Gaps 22; 

Qy 1745 TTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCATTGTC 1804 

I I I I I I I I I I I I I I II I I I 

Db 1321 T T CAT G GAGT GT GT CAAC CT GAAC AAG CT GGAAC C C ATT C C GAC AGAAGT C AG G CT CAT C 1380 

Qy 18 05 AACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGATCTTC 18 64 

I I I I I I I I I I II I I I I I I II I M I 

Db 1381 AACAAGTCCATGGAGCTGCTGGACGAGAGGAAGTTCTGGGCTGGCATCGTGTTCACAGGC 14 4 0 

Qy 18 65 CAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCC 1924 

III I I II I I I I I I I I 1 I I I I I I I I I I I I III 

Db 1441 ATCACT CCAGATAGT GTGGAGCTGCCCCATCATGTAAAGTACAAGATCCGGAT GGACATT 1500 

Qy 1925 AGCTT CAC C GAGAAAAC CAAC GAGAT C C GCCGCGCCTACTGGCGGCCTGGGCCC 1978 

II I I I I I I I I I I I I I I I 
Db 1501 GACAACGTGGAGAGAACTAATAAGATCAAGGATGGNNNNNNNNNNNNNNNNNNNNNNNNN 1560 

Qy 1979 AATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAG 2038 

Db 1561 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1620 

Qy 2039 CGCGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAG 2098 

Db 1621 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 1680 

Qy 2099 ATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATG 2158 

I I I I I I I I I I I Ml 

Db 1681 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNTTTTCTGCGGGTCATGAGCCGGTCAATG 174 0 

Qy 2159 CCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTG 2218 

I I I I I I I I I I I I I I I I I I I I I I M II I II I I I I I I I I I I I I 

Db 1741 CCCCTCTTCATGACTCTAGCCTGGATCTACTCTGTCGCTGTGATCATCAAGAGCATTGTG 1800 

Qy 2219 GCGGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTG 2278 

I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 
Db 1801 TAT GAGAAGGAGGCT C GGCT GAAGGAGAC CAT GCGGATCAT GGGT CT GGACAAT GGCAT C 1860 

Qy 2279 CACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTC 2338 

I I I I I I I I I I I I I I I I I I I I I I I I II M 

Db 18 61 CTCTGGTTTAGCTGGTTTGTTAGCAGCCTCATCCCTCTGCTTGTGAGCGCTGGCCTGCTG 192 0 

Qy 2339 ACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTC 2398 

I I I II I I I I I I I I I I I I I I I I I I II II M 



Db 


1921 


Qy 


2399 


Db 
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Qy 


2459 
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Qy 
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2101 


Qy 


2579 
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2149 


Qy 


2639 


Db 


2209 


Qy 


2699 


Db 


2269 


Qy 


2759 


Db 


2329 


Qy 


2819 


Db 


2389 


Qy 


2879 


Db 


2423 


Qy 


2939 


Db 


2480 


Qy 


2999 


Db 


2509 


Qy 


3059 


Db 


2569 


Qy 


3119 


Db 


2629 


Qy 


3179 


Db 


2689 



GTGGTCATCTTGAAGTTAGGAAACCTGCTGCCCTATAGTGACCCCAGCGTGGTGTTCGTC 1980 

TTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTAC 2458 

I I I I I II III I I I I I I I I I I I I I I I I II I I I 

TTCCTGTCTGTGTTTGCCATGGTGACCATCCTACAGTGCTTCCTCATTAGCACGCTCTTC 2 040 

TCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCC 2518 

I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCCGTGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTGCCC 2100 

T AC AT GT AC GT G G C GAT C C GAG AG GAGGT G GC GC AT G AT AAGAT C AC G GC C T T C GAG AAG 2578 

| I I I I II I I I I I I I Ml Ml 

TATGTG CTGTGCGTAGCCTGGCAGGACTATGTGGGCTTCTCCATCAAG 2148 

TGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTG 2638 

I I I I III II I I I I I I I I I I I I I I I I I I I M I I I I I I I 
ATCTTTGCTAGCCTGCTGTCTCCTGTGGCTTTTGGATTCGGCTGTGAGTATTTCGCCCTT 22 08 

TATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGG 2 698 

I | | | | I II III I I I I I II I I I II M I II I I I I I I I I I 

TTCGAGGAGCAAGGTATCGGGGTCCAATGGGACAATCTCTTTGAGAGCCCGGTGGAGGAG 2268 

GACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGC 2758 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACGGCTTCAATCTCACCACTGCAGTGTCCATGATGCTCTTTGACACCTTTCTCTATGGC 2328 

ATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGG 2818 

I I I I I I I I I I M I I I II 

GT GAT GACAT G GT ACAT C GAAGC C GT CT T T CCAGGAC AGT AT GGAAT T C C CAG GC C CT GG 238 8 

TACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGG 2878 

I I II I I I I I I I I I I I I I I II I 
TATTTTCCTTGTACCAAGTCATACTGGTTTGG TG 2422 

AGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCC 2938 

M M I I II 

AGGAAAT T GAT GAGAAGAGCCAC CCT GGT T CCAGCCAGAAGGGAGT GT CAGAAAT CT 2479 

ATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCT 2998 

I I I I I I I I I I I I I I I I I II IN 
GCAT GGAAGAGGAACC CACT CAT CT GAGG 2508 

CTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTG 3058 

MM I I I I I I II I I II I II I I I I I I M M I I 

CTGGGGGTGTCCATTCAGAACCTGGTGAAGGTTTACCGAGATGGCATGAAGGTTGCTGTG 2568 

AACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGG 3118 

| || I I M I I M I I I II I I I I I I II II I M II I I I I I I I 

GATGGCTTGGCGCTCAACTTTTACGAAGGCCAGATTACCTCCTTCCTGGGCCACAATGGA 2628 

GCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCC 3178 

II II M I II II II II II II II II I I I M M Mill II I I I I I II II I 
GCAGGGAAGACCACCACCATGTCAATACTGACTGGGCTGTTTCCCCCAACTTCTGGCACG 2688 

GCCAC CAT CTACGGGCAC GACAT C C GC ACGGAGAT GGAT GAGAT CCGCAAGAAC CT GGGC 3238 

III II I I Ml I II I I I M I I I I M II I I II M I I I M 

GC CT ACAT C CT GG G GAAGGAC AT T C GC T C G GAGAT GAG CT CC AT C C GG C AGAAC CT G GGA 2748 



Qy 3239 ATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTC 3298 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 274 9 GTCTGTCCC CAG C AT AAT GT GC T GT T T GAC AT G CT GACT GT C GAAGAG C AC AT CT G GT T C 2808 

Qy 3299 T AC T C AC G G CT C AAGAG CAT G G C T CAG GAG G AGAT C C G C AGAGAGAT G GAC AAGAT GAT C 3358 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2809 TAT GC G C G CC T AAAG G G GC T C T C AGAGAAG C AC GT GAAAG C AGAGAT G GAG C AGAT GGC C 2868 

Qy 3359 GAGGACCTGG AGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGC 3415 

I I 1 I I I I I I I I I I I I I I I I I I I I I 

Db 2 8 69 CTGGATGTTGGCTTACCCCCGAGCAAGCTGAAAAGCAAAACGAGTCAGCTCTCAGGTGGG 2 928 

Qy 3416 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 3475 

III II I I I I I I I II I I II I I I I I I I I I I I II I II II I I I I I III 

Db 2929 ATGCAGAGAAAGCTGTCTGTGGCCTTGGCCTTCGTGGGTGGATCCAAGGTTGTCATTCTG 2 98 8 

Qy 3476 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 3535 

I I I I II I I I I I II II I I I I I I I I III I I II I I II I I I I I III I I I 
Db 2 98 9 GACGAGCCCACAGCCGGGGTGGACCCGTACTCTCGCAGGGGAATATGGGAACTCCTGCTA 304 8 

Qy 3536 AAGT ACAAGC CAGGCCGCACCAT CCTT CT GT C CAC CCACCACAT GGAT GAGGCT GACCT G 3595 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3049 AAAT AC C G GCAAGGC C GC AC CAT T AT TT T GT C T ACAC AC CAC AT GGAC GAAGCT GAC AT C 3108 

Qy 3596 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 3 655 

I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I II I II 

Db 3109 CTTGGGGACAGAATTGCCATCATTTCCCATGGGAAGCTGTGTTGTGTGGGCTCCTCCCTG 3168 

Qy 3656 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 3715 

II III I I II II I I I I I I I I I I I I I I I I II 

Db 3169 T T T T T GAAAAAC C AGT T GG GAAC G GGTTAC TAT CT GAC C CT G GT T AAGAAAGAT GT G GAA 3228 

Qy 3716 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 3775 

I I I I I I I I I I II I II I I I I I II 

Db 3229 TC GTCCCTCAGTTCCTGCAGAAACAGTAGCAGCACCGTGTCTTGTCTGAAAAAG- 3282 

Qy 3776 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 3835 

I I I I I I I I I I I I I I II III I 

Db 3283 GAGGACAGTGTTTCTCAGAGCAGTTCTGATGCTGGCCTGGGCAGCGACCAT 3333 

Qy 3836 GT CT C AGACACAAGC AC GGAGC T CT C CT AC AT C CT GC CC AG C GAGG CC GC CAAGAAGG GG 3 8 95 

I I I I I I II II I I I I I I I II I I I 

Db 3334 GAAAGT GACAC G CT GAC CAT C GAT GT CT CT GCT AT CT C CAAC CT CAT C AGGAAGC AC GT G 3393 

Qy 3 8 96 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 3955 

II I I I I I I I I I I I I I I I III I I I I I 

Db 3394 TCTGAAGCCCGGCTGGTGGAGGACATTGGGCACGAGCTGACCTATGTGCTGCCGTACGAA 3453 

Qy 3956 T T C GG GCT GAT G GACAC GACC CT G GAGGAAGT GT T C CT CAAGGT GT C G GAGGAGGAT CAG 4015 

II I I I I I I I I I I I I I I I I I I III II I 

Db 3454 GCCG C GAAG GAG G GAG C CT T T GT GGAAC T C T T C CAT GAGAT T GAT GAC CGGCT CT C A 3510 

Qy 4016 T C GCT GGAGAAC AGT GAGGC C GAT GT GAAG GAGT C CAG GAAG GAT GTGCTCCCTGGGGCG 4075 

I I I I I I I I I I I I I I I I I I I I 

Db 3511 GAC CT G G GC AT CT C C AGTT AT G G CAT CT C G GAGAC CAC C CT G GAAGAAAT AT T C C T CAAA 3570 



Qy 4 07 6 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 4135 

III I I I I I I I I I II II 

Db 3571 GT G G C T GAAGAGAGC G GGGT G GAT G C T GAG AC C T C AG AT G GT AC T T T G C C AG C 3623 

Qy 4136 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 4195 

I I I I I || I II I I I I I I I I I I III M 

Db 362 4 AAGAC GAAAC AGAC GGGCCTTC G GGGACAAG CAGAG CT GT CT G CAC C C AT TT AC GGAAG A 3683 

Qy 4196 GCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCA 4255 

|| I I I I I I I I I I I 

Db 3684 TGATGC TGTTGATCCCAATGACTCT 3708 

Qy 4256 GACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGC 4315 

| M I I I I I I I II I I I I I I I I I I I I I 

Db 37 09 GACAT AGAC C C AGAAT C C AGGGAGAC C GAC CT G CT C AGT GG GAT GGAC G GC AAAGGCT C C 3768 

Qy 4316 CGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGC 4375 

I I II II I I I I I I I I I I I I I I I I I M II HI 

Db 3769 T AC CAGC T GAAG GG CT G GAAACT CAC C CAG CAAC AGTT T GTGGCCCTTTTGT GGAAGAG G 3828 

Qy 4376 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 4435 

|| I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 382 9 CTGCTGATTGCCAGACGGAGCCGGAAGGGTTTCTTTGCTCAGATTGTCCTGCCAGCTGTC 388 8 

Qy 4436 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 4495 

II II III I III II I I I I I I M II I I I I I III 

Db 388 9 TTTGTTTGCATTGCCCTGGTCTTCAGCCTGATTGTGCCACCCTTTGGCAAGTACCCCAGC 394 8 

Qy 4496 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 4555 

I I I I I I III I I I I I I I I I I M I 

Db 3949 CT GGAACTT CAGCC CT GGATGTATAAT GAGCAGT AT ACAT TT GT CAGTAATGAT GCT CC C 400 8 

Qy 4556 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 4615 

I I II I 

Db 40 0 9 GAGGACATGG GCACCCAG 4 026 

Qy 4616 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 467 5 

I I I I I I I II I II Ml II IN II 

Db 4027 GAACTCCTGAATGCTCTGACCAAAGATCCAGGCTTTGGGACCCGCTGTATGGAAGGAAAC 4086 

Qy 4676 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 4735 

|| I I I I II I I I I I I I 

Db 4 087 CC AATCCCAGATACCCCTTGCTTGGCTGGGGAGGAGGACTGGA 412 9 

Qy 4736 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 4795 

|| I I I I I I I I I I I I I I I M I 

Db 4130 C CAT CAG C C CC GT C C C C C AGAGC AT C GT GGAC CT CTT C C AGAAT G GAAACT GGAC CAT GA 4189 

Qy 4796 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 4 855 

I I I I I I I II I I I I I I I 

Db 4190 AGAACCCCTCACCTGCGTGCCAGTGTAGCAGTGACAAAATCAAGAAGATGCTGCCTGTGT 424 9 

Qy 4 856 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 4 915 

III I I I I I I I I I I I Ml I IN I IN II 

Db 4250 GT C C C C CAG GG G CAG GGGGGCTGC CAC CT C CT C AGAGAAAAC AGAAAAC C GCAGACAT C C 4309 



Qy 



4 916 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 4 975 



Db 4310 T T C AGAAT C T GAC AG GAAGAAAT AT T T C AGAT T AC CT GGT GAAGAC GT AC - GT GC AGAT C 4368 

Qy 4 97 6 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 5035 

II II II I I I I I I I II I I I I I 

Db 4369 AT AGCAAAGAG CT TAAAGAAT AAGAT C T GG GT GAAC GAGTT T C G GT AT GGCGGGTTTTC- 4427 

Qy 503 6 GGCGACATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCC 5095 

I II III I I I I III II 

Db 4 42 8 CCTGGGTGTCAGTAATTCTCAAGCACTTCCTCCGAGCCAT 44 67 

Qy 5096 GACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATC 5155 

I I I I I I I I I I I I I I 

Db 4468 GAAGTTAAT GAT GCT ATCAAGCAAAT GAAGAAACT C CT GAAGCT GAC CAAGGACAGCT CC 4527 

Qy 5156 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 5215 

III II II III I III III I I I 

Db 4 528 G CAGAT CGCTTCCT C AG C AG C CT GGGAAGGT T CAT G GCAGG GCT G GAT AC GAAAAAC AAT 4 5 87 

Qy 5216 G C CCAG GT T T T C T ACAACAACAAG GGCT AT C ACAGCAT G CC CAC CT AC CT CAAC AG C C T C 5275 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I III 

Db 4 588 GTCAAGGTGTGGTTCAATAACAAGGGCTGGCATGCTATCAGTTCGTTCCTGAATGTCATC 4 647 

Qy 5276 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 5335 

I I I II I I I I I I I I I I I I I I II II I I I I I II I I I I II I I II 

Db 4 64 8 AACAAT GC C AT T CT C C GGG C CAAC CT GC AGAAGGGAGAG AAC C C GAG C C AGT AT GG A 47 04 

Qy 5336 AT CACC GT CAC CAACCACC CCAT GAATAAGAC CAGCGCCAGCCTCT CCCT GGATTACCT G 5395 

I I I I I I I I I I I I I I II I I I I III I I I I I II III 

Db 4705 AT CACT GCT TT CAAC CAC CCCTT GAAC CTCACTAAACAGCAGCTCTCAGAGGT GGCT CTG 47 64 

Qy 5396 CT GCAGG GCACG GAT GTCGT CAT CG CCATCTTCATCATCGTGGCCATGTCCTTCGTG 5452 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 765 ATGACCACCTCTGTCGACGTCCTCGTGTCTATCTGTGTCATCTTTGCGATGTCCTTTGTC 4 824 

Qy 5453 CCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAG 5512 

II I I I I I I I I I I I I I I I I I I I III I I I I I II I I I I I I I I I I I 

Db 4 825 CCTGCCAGCTTTGTTGTGTTCCTGATCCAGGAGCGTGTGAGCAAAGCCAAGCATCTTCAG 4884 

Qy 5513 TTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTC 5572 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I 
Db 4 8 85 TTCATCAGCGGCGTGAAGCCTGTCATCTACTGGCTGTCCAATTTTGTCTGGGATATGTGC 4 944 

Qy 5573 AACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCC 5632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 4 945 AAT TAT GT GGT C C CT GCT ACACT GGT CATT AT CAT CTT C AT CT GCTT CCAGCAGAAGT C C 5004 

Qy 5633 TACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCC 5692 

II Ml I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I 

Db 5005 TATGTGTCCTCTACCAACCTGCCCGTTCTAGCCCTTCTGCTCTTGCTGTATGGGTGGTCG 5064 

Qy 5693 ATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTG 5752 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5 065 ATCACTCCTCTCATGTATCCAGCATCCTTTGTGTTCAAGATCCCCAGCACCGCCTATGTG 5124 

Qy 57 53 TTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTA 5812 

I I II I I I I I I I I I I I II I I I I I I I III I I I I I I I I I I I I II 



512 5 GTTCTCACCAGTGTGAACCTCTTCATCGGCATCAATGGCAGTGTGGCCACTTTCGTACTG 518 4 

5813 CAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTC 5872 

I I I I I I I I I II I I I I I I I I I I I I I I I I II 

5185 GAG CT GT T T AC AAACAAT AAG C T CAAT GACAT CAAT GAC AT C CT GAAGT C T GT GT TT 5241 

5873 CTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTAC 5932 

I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5242 CTTATCTTCCCACATTTTTGCCTGGGGCGAGGGCTCATCGACATGGTGAAGAACCAGGCC 5301 

5933 AT C AAC G AG T AC T AC G C C AAG AT T G G C C AG T T T GAC AAG AT G AAG TCCCCGTTC GAG T G G 5992 

II III I I I I I I I I II II I I I II I I I III 
5302 ATGGCCGATGCCCTGGAGAGGTTTGGGGAG AACCGCTTCGTCTCTCCGCTCTCTTGG 5358 

5993 GACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTG 6052 

I I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I 

5359 GACTTGGTAGGACGGAACCTTTTTGCCATGGCCGTGGAAGGGGTGGTGTTCTTCCTCATT 5418 

6053 ACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAG 6112 

II I II I I I I I I I I II I I I I I I I II 

5419 ACT GT T CT GAT C CAGT AC AGAT T T T T CAT CAG GC C CAGAC CT GT AAAGG C GAAGC T T C CT 5478 

6113 CCTGTG GAGGAT GAT GT GGAC GT GGC CAGT GAGC GG CAGC GAGT GCT C C GGG GAGAC 6169 

I I I I I II I I I I I I I I I I I I I I I I I I I I I III I I I I 

547 9 C CT T T GAAT GAC GAGGAT GAGGAT GT GAGGC GG GAGAGACAGAG GAT T CT G GAC GGTGGC 5538 

617 0 G CC GACAAT GACAT GGT CAAGAT T GAGAAC CT GAC CAAGGT C T ACAAGT C C CGGAAG AT T 6229 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
5539 GGAC AGAAT GACAT C CT AGAGAT CAAG GAACT GAC CAAGAT C T A TAGGAGG 5589 

6230 GGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGG 62 8 9 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
559 0 AAGCGGAAGCCTGCAGTCGACAGGATCTGCATCGGCATCCCTCCCGGAGAGTGCTTTGGA 564 9 

629 0 CT C CT GGG C GT CAAC GGT GCGG GC AAGAC CAG CAC CT T CAAGAT GCT GAC C G G CGAC GAG 634 9 

I I I I I I I I I I I I I I I II II III I I II I I I I II I I I I I I I I II III 
5650 CT C CT GG GAGTT AAC GGAG CT GG GAAGT CAACAACTT T CAAGAT GCT GACT GG AGAC AC C 5709 

6350 AGCACGACGGGGGGCGAGGCCTTCGT CAAT GGACACAGCGT GCT GAAGGAGCT GCT CCAG 6409 

III I I I II II I I I I I I I I I I I I II I 

5710 C CT GT GAC CAGAGGG GAT GC GT T C CT T A AC AAC AT C T TAT C AAAT AT C CAT G AA 5763 

6410 GTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCC 64 69 

I I I I II I I I I I I I I I I I II I I I I I I I I I I II I M I I I I I I I 

5764 GTACACCAGAACATGGGCTACTGCCCTCAGTTTGACGCCATCACAGAGCTGCTGACGGGA 5823 

647 0 CGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGG 6529 

I I I I I I II II I I II I I I I I I III I I I II I II I 

5824 AGAGAGC AT GT G GAGT TCTTTGCC CT C C T GAG GGGAGT C C C AGAAAAGGAAGT T G G CAAG 5883 

6530 GT G GT GAAGT GGGCT CT G GAGAAGCT G G AG CT GAC C AAGT AC GC AGACAAG CC GG CT G GC 6589 

II I I I I I II I I I I I I I III I I I I I I I I I I I II I 

58 84 GTTGGTGAATGGGCAATTCGCAAACTGGGCCTGGTAAAGTATGGAGAAAAATATGCCAGT 594 3 

6590 ACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCA 664 9 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
5944 AACT AC AGT G GC GG CAAC AAAC GAAAG CT C T C CAC AGC CAT G G C TT T GAT T G G CGGAC CT 6003 



Qy 6650 GCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTC 67 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 6004 C CT GT GGT GT T T C T G GAT GAAC C AAC C AC AGG CAT G GAC C CT AAAG C C C G G AGAT T CT T G 6063 

Qy 6710 T GGAAC CT CAT CCT C GACCT CAT CAAGACAGGGC GT T CAGT GGT GCT GACAT CAC ACAGC 6769 

I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6064 TGGAATTGTGCCCTAAGCATTGTCAAGGAGGGGAGATCTGTAGTCCTTACATCTCATAGT 6123 

Qy 6770 ATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGG 6829 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II 
Db 6124 AT GGAAGAAT GT GAAG CT C T T T GT AC AAG GAT GG CC AT AAT GGT CAAT G GAAG GT T C AGG 6183 

Qy 6830 TGCCTGGG C AG CAT C C AG CAC C T GAAG AAC C G GT T T G GAG AT G G C T AC AT GAT CAC G GT G 6889 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 6184 T G C CT T GGC AGT GT C CAAC AT C T GAAAAACAG GT TT GGAGAT GGT T AT ACAAT AGTT GT A 6243 

Qy 6890 C G GAC C AAG AG C AG C C AG AGT G TGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTC 6946 

III I I I I II I I I I I II I I II I I I I II 

Db 6244 CGAATAGCAGGCTCCAACCCTGACCTGAAGCCTGTCCAGGAGTTCTTTGGACTTGCGTTT 6303 

Qy 6947 C C G GAAG CC AT GCT C AAGGAG C GG CAC CAC AC AAAG GT GC AGT AC C AGC T CAAGT C GGAG 7 006 

I I I I I I I I I I I I I III I I I I I I I I I I I I I I I II 

Db 6304 CCGG GAAGT GT C C T AAAAGAGAAACAT C GAAAC AT G CT T CAGT AC C AGC T T C CAT C CT C C 6363 

Qy 7007 CACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATC 7066 

I I I I I I I I I I I I I I I I I III II III 

Db 6364 TT GT CAT CT CT AGCCAGGATATT CAGCAT C CT CT CCCAGAGCAAAAAGC GACT CCACAT A 6423 

Qy 7067 GAG GAC T ACT C G GT C AG C C AGAC CAC ACT G GACAAT GT GT T C GT GAACT T T GC C AAGAAG 7126 

II I I I I I I I I Ml I I I I I I I I I I III I II II I I I I I I I I I I I I I I I I 

Db 6424 GAAGACT ACT C T GT CT CT C AGAC AAC ACT T GAC CAAGT AT T T GT GAACT T T G C CAAGGAC 6483 

Qy 7127 CAGAGTGA 7134 

II I I I I I 
Db 64 8 4 CAAAGTGA 6491 
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Qy 17 4 5 T T CAT GT C C AAGGT GAGC GT G GAC AT C T T C AAGG GCT T C C C C GAC GAGGAGAGCAT T GT C 18 04 

I I I I I I I I I I I I II I II III III I I I I 

Db 1321 TT CAT GGAGT GT GT CAACCT GAACAAGCTAGAAC CCATAGCAACAGAAGT CT GGCT CAT C 138 0 

Qy 18 05 AAC T AC ACC CT CAAC C AG GC CT AC C AGGACAAC GT CACT GT T TT T GC C AGT GT GAT CT T C 1864 

I I I I I I I I I I 111 I I I I III II 

Db 1381 AACAAGT C CAT G GAGCT G CT G GAT GAGAG GAAGT TCTGGGCT GGT AT T GT GT T CAC T GGA 144 0 

Qy 1865 CAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCC 1924 

III I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1441 AT T AC T C C AG G C AG CAT T GAG CT G C C C CAT CAT G T C AAGT AC AAG AT C C GAAT G GAC AT T 1500 

Qy 1925 AGCTT CACCGAGAAAACCAAC GAGAT C CGCCGCGCCTACTGGCGGCCTGGGCCC 1978 

I MM II II I III I 

Db 1501 GACAAT GT GGAGAGGACAAATAAAAT CAAGGATGGNNNNNNNNNNNNNNNNNNNNNNNNN 1560 

Qy 1979 AATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAG 2038 

Db 1561 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 162 0 

Qy 2039 CGCGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAG 2098 

Db 1621 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 168 0 

Qy 2099 ATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATG 2158 

Ml III I I I I I III 

Db 1681 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTTCTGCGGGTGATGAGCCGGTCAATG 17 4 0 

Qy 2159 CCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTG 2218 

I I I I I I II I II I I I I I I I I I I I II II I I M I I I I I I II II I I I 
Db 1741 CCCCTCTTCATGACGCTGGCCTGGATTTACTCAGTGGCTGTGATCATCAAGGGCATCGTG 1800 



Qy 


2219 


GC G GAGAAG GAGC AC C G G C T CAAGGAGGT GAT GAAGAC CAT G G G C CT GAACAAC GCGGT G 

I I 1 1 1 t l 1 1 l 1 1 1 1 II Mi III II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 

I 1 1 1 M 1 1 1 Mill II IN III M 1 M 1 II 1 1 1 1 MIM 1 
TAT GAGAAG GAGGC AC G GC T GAAAGAGAC CAT GC GGAT CAT GG GC CT G GAC AAC AGC AT C 


2278 


Db 


1801 


1860 


Qy 


2279 


CACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTC 

■ iiit i i i i i i i i i i i mi ii i i I II II 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 II 1 1 

CTCTGGTTTAGCTGGTTCATTAGTAGCCTCATTCCTCTTCTTGTGAGCGCTGGCCTGCTA 


2338 


Db 


1861 


1920 


Qy 


2339 


ACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTC 
i i i i i i i i i i i i ti i i i i i i i i i i II II II 


2398 


Db 


1921 


1 1 1 II 1 II 1 1 1 1 II 1 INI MM 1 II 1 1 11 
GTGGTCATCCTGAAGTTAGGAAACCTGCTGCCCTACAGTGATCCCAGCGTGGTGTTTGTC 


1980 


Qy 


2399 


TTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTAC 

i i i i i i i ii i ii i i i i ii mi ii i i i i i i i i i I II I I 
1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 II 1 1 1 1 1 

TTCCTGTCCGTGTTTGCTGTGGTGACAATCCTGCAGTGCTTCCTGATTAGCACACTCTTC 


2458 


Db 


1981 


2040 


Qy 


2459 


TCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCC 

■ i i i i i i i i i i i i i i i i i i i ii i i i t i i i i i i i i i i i i iii i i i i i 
INI 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 II 1 1 1 1 1 1 1 1 Ml Mill 

TCCAGAGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTGCCC 


2518 


Db 


2041 


2100 


Qy 


2519 


T AC AT GT AC GT GG C GAT C C GAG AG GAG GT G G C GC AT GAT AAG AT C AC G G C C T T C GAGAAG 

iii iii iii i i i i i i i I III 
I I 1 M 1 III M 1 1 1 1 1 1 Ml 

TAC GTCCTGTGTGTGGCATGGCAGGACTACGTGGGCTTCACACTCAAG 


2578 


Db 


2101 


2148 


Qy 


2579 


TGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTG 

i i i i i iii i i i i i iii i i i i i i i i i i i i i i I I I i II II 
| MM III II II 1 Ml 1 M I 1 1 MM 1 II M M 1 II II 

ATCTTCGCTAGCCTGCTGTCTCCTGTGGCTTTTGGGTTTGGCTGTGAGTACTTTGCCCTT 


2638 


Db 


2149 


2208 


Qy 


2639 


TATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGG 

i itiii i iii i i i i i t i i i i iii i i ii II I I I I I I I 
I I I II 1 1 1 II 1 1 1 1 II 1 II 1 1 1 1 1 1 M 1 I 1 1 1 1 1 1 1 

TTTGAGGAGCAGGGCATTGGAGTGCAGTGGGACAACCTGTTTGAGAGTCCTGTGGAGGAA 


2698 


Db 


2209 


2268 


Qy 


2699 


GACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGC 

ii i i i i i i i i i i iii i i i i i ii ii i iii ii i i I I I I l l 
|| | | | I M 1 1 1 1 M 1 1 1 1 II II M 1 1 1 1 M 1 1 M M M 

GATGGCTTCAATCTCACCACTTCGGTCTCCATGATGCTGTTTGACACCTTCCTCTATGGG 


2758 


Db 


2269 


2328 


Qy 


2759 


ATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGG 

i i ii i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I lit 1 1 1 1 1 1 1 1 
I | M 1 1 M 1 II 1 1 II II II 1 1 1 II II 1 1 II M 1 1 III l l 1 1 I I I I 

GTGATGACCTGGTACATTGAGGCTGTCTTTCCAGGCCAGTACGGAATTCCCAGGCCCTGG 


2818 


Db 


2329 


2388 


Qy 


2819 


TACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGG 
ii ii ii i i i i i i i i i i i i i iii i i 

1 1 1 1 II 1 M M 1 M M M 1 M 1 1 1 


2878 


Db 


2389 


2429 


Qy 


2879 


AGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCC 

1 1 1 1 1 Mi t till 

1 M II Ml 1 1 l l l 


2938 


Db 


2430 


2454 


Qy 


2939 


ATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCT 

| | | | I I II II 1 11 1 1 1 II 1 II II 1 M 1 1 1 1 1 1 
AACCAGAAGAGAATATCAGA AAT CT G CAT GGAGG AGGAAC C C AC C C ACT T GAAG 


2998 


Db 


2455 


2508 


Qy 


2999 


CTGGTTGTCTGCGTG GAC AAACT CAC CAAGGT CT AC AAGGAC GACAAGAAG CT G GC C CT G 

MM 1 I 1 1 1 1 II 1 1 1 1 1 II 1 1 1 III 1 M II 1 1 II 1 

CTGGGCGTGTCCATTCAGAACCTGGTAAAAGTCTACCGAGATGGGATGAAGGTGGCTGTC 


3058 


Db 


2509 


2568 



Qy 3059 AACAAGCT GAGCCT GAACCTCTACGAGAACCAGGTGGT CT CCTTCTT GGGCCACAACGGG 3118 

I III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2569 GATGGCCTGGCACTGAATTTTTATGAGGGCCAGATCACCTCCTTCCTGGGCCACAATGGA 2 62 8 

Qy 3119 GCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCC 3178 

I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I I I I I I I I I I II 

Db 2 62 9 GCGGGGAAGACGACCACCATGTCAATCCTGACCGGGTTGTTCCCCCCGACCTCGGGCACC 2 68 8 

Qy 3179 G C C AC CAT C T AC G G G C AC G AC AT C C G C AC G GAG AT G GAT GAG AT C C G C AAG AAC C T G G G C 3238 

III I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2 68 9 GCCTACATCCTGGGAAAAGACATTCGCTCTGAGATGAGCACCATCCGGCAGAACCTGGGG 2748 

Qy 3239 ATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTC 3298 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 274 9 GTCTGTCCCCAGCATAACGTGCTGTTTGACATGCTGACTGTCGAAGAACACATCTGGTTC 2 808 

Qy 3299 TACT C AC GGCT CAAGAGC AT G G C T C AG GAG GAGAT C C GCAGAGAGAT G GACAAGAT GAT C 3358 

II III III I I I I I I II I I I I I I I I I I Mill I 

Db 28 09 TAT G C C C GCT T GAAAGG GC T CT CT GAGAAG C AC GT GAAGGC G GAGAT G GAGC AGAT GGC C 2 868 

Qy 3359 GAGGACCTGG AGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGC 3415 

I I I I I I I I I I I I I I I I I I I I I I I II 

Db 28 69 CTGGATGTTGGTTTGCCATCAAGCAAGCTGAAAAGCAAAACAAGCCAGCTGTCAGGTGGA 2 92 8 

Qy 3416 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 3475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 929 ATGCAGAGAAAGCTATCTGTGGCCTTGGCCTTTGTCGGGGGATCTAAGGTTGTCATTCTG 2988 

Qy 3476 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 3535 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I 
Db 2 989 GATGAACCCACAGCTGGTGTGGACCCTTACTCCCGCAGGGGAATATGGGAGCTGCTGCTG 304 8 

Qy 353 6 AAG T AC AAG C C AG G C C G C AC CAT CCTTCTGTC C AC C C AC C AC AT G GAT GAG GCT G AC C T G 3595 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 3049 AAAT AC C GACAAGG C C G C AC CAT TAT T C T CT CT ACACAC C AC AT G GAT GAAGC GGAC GT C 3108 

Qy 3596 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 3655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I I II 

Db 3109 CTGGGGGACAGGATTGCCATCATCTCCCATGGGAAGCTGTGCTGTGTGGGCTCCTCCCTG 3168 

Qy 3656 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 3715 

I I I I I I I I II I I I I I I I I II I I I I I I I I II 

Db 3169 TT T C T GAAGAAC C AGC T G G GAAC AG G CT ACT AC CT GAC CT T G GT CAAGAAAG AT GT GG — 3226 

Qy 3716 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 3775 

III I I I I I I I I I I I I 

Db 3227 AAT CCT CC CT CAGTT C CT GCAGAAACAGTAGT AGCACT GT GT CAT AC 3273 

Qy 37 7 6 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 3835 

I I I I I I I I I I I I I III I I I I 

Db 3274 CTGAAAAAGGAGGACAGTGTTTCTCAGAGCAGTTCTGATGCTGGCCTGGGCAGCGACCAT 3333 

Qy 3836 GT C T C AG AC AC AAG C AC G GAG C T C T C C T AC AT C C T G C C C AG C GAG G C C G C C AAG AAG G G G 3895 

I I I I I I II II I I I I I I I I I I I I 

Db 3334 GAGAGT GAC AC GCT GAC CAT C GAT GTCTCTGC TAT C T C CAAC CT C AT C AG GAAGC AT GT G 3393 

Qy 389 6 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 3955 



Db 3394 T CT GAAGC C C GGCT GGT GGAAGACAT AGGGCAT GAGCT GAC CTATGT GCT GC CAT AT GAA 3453 

Qy 3956 TTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAG 4 015 

I I I I I I I I I II I I I I I I III II I 

Db 3454 GCTGCTAAGGAGGGAGCCTTTGTGGAACTCTTTCATGAGATTGATGACCGGCTCTCA 3510 

Qy 4 016 T C G CT GGAGAAC AGT GAGGC C GAT GT GAAG GAGT C CAG GAAGGAT GT GCTCCCTGGGGCG 4 075 

I I I I I I II I I I I I I I I I I I 

Db 3511 GAC C T G G G CAT T T C TAG T TAT G G CAT C T CAG AG AC GAC C C T G G AAG AAAT AT T C C T C AAG 3570 

Qy 407 6 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 4135 

I I I I I I I I I I I I I I I I I I II 

Db 3571 GT G GC C GAAGAGAGT G G G GT G GAT GCT G AGAC CT C AGAT GGT AC CT T G C C AGC AAGAC GA 3630 

Qy 4136 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 4195 

I I I I I I I II II I I I I I I I II II II I 

Db 3631 AACAGGCGGGCCTTCGGGGACAAGCAGAGCTGTCTTCGCCCGTTCACTGAAGATGATGCT 3690 

Qy 4196 GCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCA 4255 

I I I I I III I II I 

Db 3691 GCTG AT C C AAAT GAT T CT 3708 

Qy 4256 GACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGC 4315 

I I I I I I II I II I I I I I I I I I I I 

Db 3709 GACAT AGACC CAGAAT CCAGAGAGACAGACTT GCT CAGT GGGAT GGAT GGCAAAGGGT CC 3768 

Qy 4316 CGCAAGCTGGACGGCGGGT GGCT GAAGGTGCGCCAGTTCCACGGGCT GCT GGT CAAACGC 4375 

I I I I I I I I I I I II I II I I I II I II II II I 

Db 37 69 TACCAGGTGAAAGGCTGGAAACTTACACAGCAACAGTTTGTGGCCCTTTTGTGGAAGAGA 3828 

Qy 437 6 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 4435 

II III I II I I I I I I I I I I I I I I I II I I I I I I 

Db 382 9 CTGCTAATTGCCAGACGGAGTCGGAAAGGATTTTTTGCTCAGATTGTCTTGCCAGCTGTG 38 88 

Qy 4436 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 4495 

II I I I II I I I I I I I I I I I I I I I I I I I I I III 

Db 38 8 9 TTTGTCTGCATTGCCCTTGTGTTCAGCCTGATCGTGCCACCCTTTGGCAAGTACCCCAGC 394 8 

Qy 4496 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 4555 

I I I I I I III MM II I I I I I I I I II 

Db 3 94 9 CT G GAAC T T CAGCC C T G GAT GT ACAAC GAACAGTACAC AT TT GT CAG CAAT GAT GCT C CT 4 008 

Qy 4556 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 4615 

I I I I I I I I I I 

Db 4009 GA GGACACGGGAACCCTG 4026 

Qy 4616 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 4 675 

I II I I I I I II III III II III II 

Db 4 027 GAACT CT TAAAC GC C CT CACCAAAGACCCT GGCTT CGGGACC CGCT GT ATGGAAGGAAAC 4086 

Qy 4 67 6 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 4735 

II I I I I I I I I I I I I I I I I I I II I I I 

Db 4087 CCAATCCCAGACACGCCCTG--CCAGGCAGGGGAGGAAGAGTGGACCACTGCCCCAG 4141 

Qy 4736 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 47 95 

I II I I I I I I I I I I I I I I M I I 



Db 



4142 



T T C C C C AGAC CAT C AT GGAC CT C T T C CAGAAT GG GAACT GGACAAT G C 418 9 



Qy 4796 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 4 8 55 

I I I I I I I I I I I I I I I I I I 

Db 4190 AGAAC CCT T C AC CT G CAT GCC AGT GT AGC AG C GACAAAAT CAAGAAGAT GCTGCCTGTGT 424 9 

Qy 4 856 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 4915 

I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4250 GTCCCCCAGGGGCAGGGGGGCTGCCTCCTCCACAAAGAAAACAAAACACTGCAGATATCC 4309 

Qy 4 916 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 4 975 

II II I I I I I I I I I I I I I I I I I 

Db 4310 T TCAGGAC CT GACAGGAAGAAACATTT CGGATT AT CT GGT GAAGACG- T AT GT GCAGATC 4368 

Qy 497 6 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 5035 

III II I I I I I I I I I I I I I I I 

Db 43 69 AT AG C CAAAAG C T T AAAGAAC AAG AT CT GGGT GAAT GAG TTTAGGTATGGCGGCT 4423 

Qy 5036 GGCGACATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCC 5095 

I I I I I I I I I I I II I I I I I I I 

Db 442 4 T T T CC CT GGGT GT C AGTAATACT CAAGC ACT T C CT C C GAGT CAAGAAGT TAAT GAT G C C A 44 83 

Qy 5096 GACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATC 5155 

I II I I I I I I I I I 

Db 4484 T C AAAC AAAT GAAGAAAC AC CT AAAG CT GGC CAAGGACAGTT CT 4527 

Qy 5156 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 5215 

I I I I I I I I I I I I I III II I I 

Db 452 8 GCAGATCGATTTCTCAACAGCTT GGGAAGATTTATGACAGGACT GGACACCAAAAATAAT 4587 

Qy 5216 GCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTC7\ACAGCCTC 5275 

I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I III 

Db 4 58 8 GTCAAGGTGTGGTTCAATAACAAGGGCTGGCATGCAATCAGCTCTTT CCT GAAT GT CATC 4 647 

Qy 527 6 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 5335 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I 

Db 464 8 AACAATGCCATTCTCCGGGCCAACCTGCAAAAGGGAGAG AAC C CT AGC C AT TAT G GA 4704 

Qy 5336 ATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTG 5395 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 

Db 47 05 ATTACTGCTTTCAATCATCCCCTGAATCTCACCAAGCAGCAGCTCTCAGAGGTGGCTCTG 47 64 

Qy 539 6 CTGCAGGGCAC GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTG 5452 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4765 ATGACCACATCAGTGGATGTCCTTGTGTCCATCTGTGTCATCTTTGCAATGTCCTTCGTC 4824 

Qy 5453 CCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAG 5512 

I I I I I II I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 4 82 5 CCAGCCAGCTTTGTCGTATTCCTGATCCAGGAGCGGGTCAGCAAAGCAAAACACCTGCAG 4 8 84 

Qy 5513 TTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTC 5572 

II I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I 

Db 48 85 TTCATCAGTGGAGTGAAGCCTGTCATCTACTGGCTCTCTAATTTTGTCTGGGATATGTGC 4 94 4 

Qy 557 3 AACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCC 5632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 4945 AATTACGTTGTCCCTGCCACACTGGTCATTATCATCTTCATCTGCTTCCAGCAGAAGTCC 5004 



Qy 5633 TACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCC 5692 

II III I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I 

Db 5005 TATGTGTCCTCCACCAATCTGCCTGTGCTAGCCCTTCTACTTTTGCTGTATGGGTGGTCA 5064 

Qy 5693 ATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTG 5752 

I I I I I I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5065 AT C ACAC CT CT C AT GT AC C CAGC CTCCTTTGTGTT CAAGAT C C C CAG CAC AGC C TAT GT G 5124 

Qy 5753 TTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTA 5812 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 5125 GTGCTCACCAGCGTGAACCTCTTCATTGGCATTAATGGCAGCGTGGCCACCTTTGTGCTG 5184 

Qy 5813 CAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTC 5872 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml 

Db 5185 GAGCTGTTC AC C GACAAT AAG C T GAAT AAT AT CAAT GAT AT C CT GAAGT C C GT GT T C 5241 

Qy 587 3 CTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTAC 5932 

I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 5242 TTGATCTTCCCACATTTTTGCCTGGGACGAGGGCTCATCGACATGGTGAAAAACCAGGCA 5301 

Qy 5933 AT C AAC GAGT AC T ACGCCAAGAT T GGCC AGT TT GAC AAGAT GAAGT C C C C GT T C GAGT GG 5992 

II II I I I I I I I I I I I I I I I I I I I I IN 

Db 5302 ATGGCTGATGCCCTGGAAAGGTTTGGGGAGAATCGCTTTGT GTCACCATTATCTTGG 5358 

Qy 5993 GACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTG 6052 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5359 GACTTGGTGGGACGAAACCTCTTCGCCATGGCCGTGGAAGGGGTGGTGTTCTTCCTCATT 5418 

Qy 6053 ACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAG 6112 

I I I II I I I I II I I I I I I I I I I I I M 

Db 5419 ACT GT T CT GAT C C AGT AC AGAT T C TT CAT C AGG C C CAGAC CT GT AAAT G CAAAG CT AT CT 547 8 

Qy 6113 CCTGTG GAG GAT GAT GT G GAC GT GG CC AGT GAGC GGCAGC GAGT GCT CC GGGGAGAC 6169 

I I I I I I I I I I I II I I I I I III I I I I II I I I III 

Db 54 7 9 C CT C T GAAT GAT GAAGAT GAAGAT GT GAG GC G GGAAAGAC AGAGAAT T CT T GAT G GT GGA 5538 

Qy 617 0 GCCGACAAT GACAT GGT CAAGAT T GAGAACCT GACCAAGGT CTACAAGT CCCGGAAGATT 6229 

I I I I I I I I I I I I III III I I I I II I I I I I I 

Db 5539 G G C C AGAAT GACAT CT TAG AAAT C AAG GAGT T GAC GAAGAT AT A TAGAAGG 5589 

Qy 6230 GGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGG 6289 

Ml I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 5590 AAGCGGAAGCCTGCTGTTGACAGGATTTGCGTGGGCATTCCTCCTGGTGAGTGCTTTGGG 5 64 9 

Qy 6290 CTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAG 634 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5650 CT C CT GG GAGT T AAT G G G G CT GGAAAAT CAT CAAC T T T CAAGAT GTT AAC AG GAGAT AC C 5709 

Qy 6350 AGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAG 64 09 

I I I I I I I I I I I I I I I I II III I 

Db 5710 AC T GT T AC CAGAG GAGAT GCTTTCCT T AAC AANNNNNN T AT C T TAT CAAAC AT C CAT GAA 5769 

Qy 6410 GTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCC 6469 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 577 0 GTACATCAGAACATGGGCTACTGCCCTCAGTTTGATGCCATCACAGAGCTGTTGACTGGG 5829 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



6470 CGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGG 6529 

I I I I I I I I I I I I II I I I II III I I I I I I II I 
583 0 AGAGAACAC GT G GAGTT CTTTGCCCTTTT GAGAG GAGT C CC AGAGAAAGAAGT T GG C AAG 58 89 

6530 GTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGC 658 9 

III I I I II I I I I I I I I I I M I I I I I I I I I I I I I II I 

5890 GTTGGTGAGTGGGCGATTCGGAAACTGGGCCTCGTGAAGTATGGAGAAAAATATGCTGGT 5949 

6590 ACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCA 6649 

I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II 
5950 AACTATAGTGGAGGCAACAAACGCAAGCTCTCTACAGCCATGGCTTTGATCGGCGGGCCT 6009 

6650 GCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTC 6709 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6010 CCTGTGGTGTTTCTGGATGAACCCACCACAGGCATGGATCCCAAAGCCCGGCGGTTCTTG 6069 

6710 T G GAAC C T CAT C C T C G AC C T CAT C AAG AC AG G G C GT T C AGT G G T G C T G AC AT C AC AC AG C 67 69 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

6070 T GGAAT T GT GC CC T AAGT GT T GT C AAGGAG GG GAGAT C AGT AGT G CT T AC AT CT CAT AGT 6129 

6770 ATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGG 682 9 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M 
6130 AT GGAAGAAT GT GAAGCTCTTT GCACTAGGAT GGCAAT CAT GGT CAAT GGAAGGTT CAGG 618 9 

6830 TGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTG 68 8 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
6190 T GCC TT GGCAGT GT C C AGC AT CT AAAAAAT AG GT T T GGAGAT G GT T AT ACAAT AGT T GT A 6249 

6890 CGGA C CAAGAGCAG C C AGAGT GT GAAGGAC GT G GT G CG GT T C T T CAAC C GCAACT T C 6946 

III I I I I I I I I I I I I II I I I I I I I M 

6250 CGAATAGCAGGGTCCAACCCGGACCTGAAGCCTGTCCAGGATTTCTTTGGACTTGCATTT 6309 

6947 C C GGAAGC CAT GC T CAAGGAG C GGCAC C ACACAAAGGT GCAGT AC C AG CT CAAGT C GGAG 7006 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

6310 C C T GGAAGT GT T CTAAAAGAGAAAC AC C GGAACAT G CT ACAAT AC C AG CT T C CAT CT T CA 6369 

7007 CACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATC 7 066 

I I I I I I I I I I I I I I I I I I III II Ml 

6370 T T AT CT T CT CT GG C C AG GAT AT T C AG CAT C CT CT C C CAGAGC AAAAAGC GACT C C AC ATA 6429 

7067 GAG G AC T AC T C G G T C AG C C AG AC C AC AC T G GAC AAT GTGTTCGT GAAC T T T G C C AAG AAG 712 6 

II I I II I I I I II I I I I I I I I I I III I II II I I I I I I I I I I I I I I I I 

6430 GAAGAC TACT CT GT T T CT CAGACAAC ACTT GAC CAAGT ATT T GT GAAC T T T G C C AAG GAC 64 89 

7127 CAGAGTGA 7134 

II I I I I I 
6490 CAAAGTGA 6497 
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Location/Qualif iers 

1. .6606 

/organism="Pan troglodytes" 

/mol_type=" genomic DNA" 

/db_xref= ,f taxon:9598" 

<1. .>6606 

/gene="ABCAl" 

/locus_tag= n HCM2235" 



ORIGIN 



Query Match 11.7%; 
Best Local Similarity 47.2%; 
Matches 2551; Conservative 



Score 942.8; DB 29; 
Pred. No. l.le-135; 
0; Mismatches 2611; 



Length 6606; 
Indels 243; Gaps 17; 



Qy 1745 T T CAT GT C C AAG GT GAGC GT G GAC AT CT T C AAG GGCTTCCCC GAC GAG G AGAGC AT T GT C 18 04 

I I I I I I I I I I I I I I I II III 111 I I I I 

Db 1321 TT CAT GGAGT GT GT CAACCTGAACAAGCTAGAACC CATAGCAACAGAAGT CT GGCT CAT C 1380 

Qy 1805 AACT AC AC C CT C AAC C AG G C C T AC C AG G AC AAC GT C AC TGTTTTTGC C AGT GT GAT C T T C 18 64 

I I I I I I I I I I III MM III II 

Db 1381 AACAAGTCCATGGAGCTGCTGGATGAGAGGAAGTTCTGGGCTGGTATTGTGTTCACTGGA 1440 

Qy 1865 CAGAC C C GGAAGGACG GCT CGCT C C C G C C T C AC GT GC ACT ACAAGAT C C GC C AGAACT C C 1924 

III I I I I I I I I II I I I II II I I I I I I I III 

Db 1441 AT TACT C C AG G CAGCAT T GAG CT G C C C CAT CAT GT CAAGT ACAAGAT C C GAAT G GAC AT T 1500 

Qy 1925 AG CT T C AC C GAGAAAAC C AAC GAG AT C CGCCGCGCCTACTGGCGGCCTGGGCCC 1978 

I I M I I I M I I II I 

Db 1501 GACAATGTGGAGAGGACAAATAAAATCAAGGATGGNNNNNNNNNNNNNNNNNNNNNNNNN 1560 



QY 



1979 AATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAG 2038 



Db 



1561 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 162 0 



Qy 


2039 


CGCGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAG 


o n Q R 


Db 


1621 


NNNNNNNNNNNNNNNNNNNNNNNNNNNNNN^ 


168 0 


Qy 


2099 


AT G T T C C C C T AC C C C T G C T AC AC AC G C GAT G AC TTCCTGTTTGT CAT T GAG C AC AT GAT G 

111111 111 1 1 1 1 1 
NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCTTTCTGCGGGTGATGAGCUbbl ^ 


_. J. sJ 1 O 


Db 


1681 


i 74 n 


Qy 


2159 


CCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTG 

I I 1 1 1 1 II 1 II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

CCCCTCTTCATGACGCTGGCCTGGATTTACTCAGTGGCTGTGATCATCAAGGGUA1 CGI _» 


991 ft 


Db 


1741 


i pnn 

lOUU 


Qy 


2219 


GCGGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTG 

1 1 1 1 1 1 II 1 Mill II 1 II Ml 1 1 1 1 1 1 II II 1 1 1 1 1 M 1 
TAT GAGAAG GAGGC AC G G C T GAAAGAGAC CAT G C G GAT CAT G GGC CT GGACAAC AG LA1L 




Db 


1801 


1 ft 60 


Qy 


2279 


CACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTC 

I II II 1 1 II 1 1 1 1 1 1 1 III II M 1 II M 
CTCTGGTTTAGCTGGTTCATTAGTAGCCTCATTCCTCTTCTTGTGAGCGCTGGCCTGCTG 


9 ^ ^ ft 


Db 


1861 


i y z u 


Qy 


2339 


ACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTC 
1 II I I II 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 II MM 

GTGGTCATCCTGAAGTTAGGAAACCTGCTGCCCTACAGTGATCCCAGCGTGGTGI 1 1G1U 


O ^ Q fi 

z _» y o 


Db 


1921 


1 q ft n 


Qy 


2399 


TTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTAC 

I I I II 1 1 1 1 M 1 1 1 1 1 II II Ml MM 

TTCCTGTCCGTGTTTGCTGTGGTGACAATCCTGCAGTGCTTCCTGATTAGCACACTCTIC 


9 A ^ P 
Z ft O o 


Db 


1981 


9 n n 


Qy 


2459 


TCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCC 

I II 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 M 1 II 1 1 1 II 1 II 1 1 1 II II II 
TCCAGAGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTACCC 


-Olo 


Db 


2041 


9 1 n n 
zlUU 


Qy 


2519 


T AC AT GT AC GT G G C GAT C C GAGAG GAG GT GGC GC AT GAT AAGAT C AC GGC C T T C GAGAAG 

Ml Ml 1 II 1 M 1 1 1 1 1 M 1 

TAC GTCCTGTGTGTGGCATGGCAGGACTACGTGGGCTTCACACTCAAO 


9 ^7 ft 


Db 


2101 


9 1 /l « 
Z i. O 


Qy 


2579 


TGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTG 

| | | | | Ml II II 1 1 II 1 M II II 1 1 1 II 1 1 II 1 1 1 M 1 
ATCTTCGCTAGCCTGCTGTCTCCTGTGGCTTTTGGGTTTGGCTGTGAGTACTTTGCCCTT 


Z Do O 


Db 


2149 


9 9 n R 
Z Z U O 


Qy 


2639 


TATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGG 

| I 1 II II II II 1 1 1 II 1 II II 1 M 1 M 1 1 1 1 M II 1 
T T T GAG GAGCAGG G CAT T GGAGT G C AGT GGGACAAC CT GT T T GAGAGT C C 1 G I GGAGGAA 


9 £Q ft 
Z D y D 


Db 


2209 


9 9 6ft 
Z Z O D 


Qy 


2699 


GACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGC 

|| I || II 1 1 1 1 1 1 M 1 M 1 M M II II II M II 1 M II 
GATGGCTTCAATCTCACCACTTCGGTCTCCATGATGCTGTTTGACACCTTCCTCTATGGG 


9 7 ^ ft 
Z / D O 


Db 


2269 


9 ^9 ft 
Z _>Z D 


Qy 


2759 


ATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGG 

1 1 II 1 1 II II II II 1 1 1 M II 1 II 1 II 1 1 1 1 M II 1 II M 

GT GAT GAC CT G GT AC AT T GAG GCT GT C T T T C C AGGC C AGT AC GGAAT T C C CAGG U L, L. 1 CjLi 


9 ft 1 ft 
Z O J. o 


Db 


2329 


9 ^ ft ft 
Z o O 0 


Qy 


2819 


TACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGG 
MUM II 1 1 M II 1 1 1 II 1 1 1 


2878 


Db 


2389 


2422 


Qy 


2879 


AGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCC 


2938 



Db 2423 AGGAAAGT GAT GAGAAG AG C C AC CCTGGTTC CAG C CAAAAGAGAAT GT CAGAAAT CT 2479 

Qy 2 939 AT GGAGAGC CGGCGCTTT GAG G AGAC C C GT GGC AT G GAGGAG G AGC C C AC C C AC C T G C C T 2998 

I I I II I II I I I I I I I I I I I II II I I 
Db 24 80 G CAT G GAG GAG GAAC C C AC C CAC CT GAAG 2508 

Qy 2 999 CTGGTTGTCTGCGTG G AC AAACT CAC C AAG GT CT AC AAG G AC GAC AAG AAG CTGGCCCTG 3058 

I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I 

Db 2509 CTGGGCGTGTCCATTCAGAACCTGGTAAAAGTCTACCGAGATGGGATGAAGGTGGCTGTN 2568 

Qy 3059 AACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGG 3118 

I III Mill I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2569 NATGGCCTGGCACTGAATTTTTATGAGGGCCAGATCACCTCCTTCCTGGGCCACAATGGA 2628 

Qy 3119 GCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCC 317 8 

I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2 62 9 GCGGGGAAGACGACCANNNNGTCAATCCTGACCGGGTTGTTCCCCCCGACCTCGGGCACC 268 8 

Qy 3179 G C CAC CAT CT AC GGGC AC GAC AT C C GCACG GAGAT G GAT GAGAT C CGCAAGAACC T G GG C 3238 

III I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2689 G C CT ACAT C CT GGGAAAAGAC AT T C GCT CT GAGAT GAGC AC CAT C C GGC AGAAC CT G GG G 2748 

Qy 3239 ATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTC 3298 

I II II I I I I I II I I I I I I I I I I I III II II II I I I I I I I I I I II I I 
Db 274 9 GTCTGTCCCCAGCATAACGTGCTGTTTGACNNGCTGACTGTCGAAGAACACATCTGGTTC 28 08 

Qy 3299 TACT CAC G G CT C AAG AG CAT G GCT CAG GAG GAGAT C C G C AG AGAG AT GGAC AAGAT GAT C 3358 

II III III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 8 09 TAT GCCCGCTT GAAAGGGCTCTCT GAGAAGCACGT GAAGGC GGAGAT GGAGCAGAT GGC C 28 68 

Qy 3359 GAGGACCTGG AGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGC 3415 

III II II I I I I I I I I I I I I I I I I I I 

Db 2 8 69 CT GGAT GT T G GT T T G C CAT C AAG C AAG CT GAAAAG C AAAAC AAG C C AG CT GT CAG GT GGA 2928 

Qy 3416 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 3475 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 292 9 ATGCAGAGAAAGCTATCTGTGGCCTTGGCCTTTGTCGGGGGATCTAAGGTTGTCATTCTG 2 988 

Qy 347 6 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 3535 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I Ml 
Db 2 98 9 GATGAACCCACAGCTGGTGTGGACCCTTACTCCCGCAGGGGAATATGGGAGCTGCTGCTG 304 8 

Qy 3536 AAGT AC AAG C CAG G C C G CAC CAT CCTTCTGTC CAC C CAC CAC AT G GAT GAG GCT GAC C T G 3595 

I I I II I M I I I II II I I I I I I I II I I I I I I I I II M I I I I I I II I I 

Db 304 9 AAAT AC C GACAAG G C C G CAC CAT TAT T CT CT CT AC ACAC CACAT GGAT GAAGC GGAC AT C 3108 

Qy 3596 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 3655 

II I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I II MUM I M 

Db 3109 CTGGGGGACAGGATTGCCATCATCTCCCATGGGAAGCTGTGCTGTGTGGGCTCCTCCCTG 3168 

Qy 3656 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 3715 

I I I I II I I II I I I I I I I I I I I I II I I I I I I I 

Db 3169 T T T C T GAAGAAC CAG C T G G GAAC AG G CT AC T ACC T GAC C C T GGT CAAGAAAGAT GT GG — 3226 

Qy 3716 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 3775 

II I I I I II I I I I I I I 



Db 3227 AATC CT CCCT CAGTT CCT GCAGAAACAGT AGTAGCACT GT GT CAT AC 3273 

Qy 3776 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 3835 

I I I I II I I I I I I I III I I I I 

Db 3274 C T GAAAAAGGAG GAC AGT GTT T C T C AGAGC AGT T CT GAT GCTGGCCTG G GC AG CGAC CAT 3333 

Qy 38 36 G T C T C AG AC AC AAG C AC G GAG C T C T C C T AC AT C C T G C C C AG C GAG G C C G C C AAG AAG G G G 3895 

I I I I I I II II I I I I I I 1 I I I I I 

Db 3334 GAGAGT GACACGCT GAC CAT C GAT GT CT CT GCTAT CT CCAACCT CAT CAGGAAGCAT GT G 3393 

Qy 38 96 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 3955 

II I I I I I I I I I I I I I III I I I I 

Db 3394 TCTGAAGCCCGGCTGGTGGAAGACATAGGGCATGAGCTGACCTATGTGCTGCCATATGAA 3453 

Qy 3956 TTCGGGCT GAT GGACAC GACC CT GGAGGAAGT GTT CCT CAAGGT GT C GGAGGAGGAT CAG 4015 

I I I I I I I I I I I I I I I I I I III II I 

Db 3454 GCTGCTAAGGAGGGGGCCTTTGTGGAACTCTTTCATGAGATTGATGACCGGCTCTCA 3510 

Qy 4016 TCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCG 4 075 

I I I I I I II I I I I I I I I I I I 

Db 3511 GACCT GGGCATT T CT AGTT AT GGCAT CT CAGAGACGACC CT GGAAGAAATATT C CT CAAG 3570 

Qy 4076 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 4135 

I I I I I I I I I I I I I I I I I I II 

Db 3571 GT G G C C GAAGAGAGT G G G GT G GAT GCT GAGAC CT C AGAT G GT AC CT T G C CAGC AAGAC G A 3630 

Qy 4136 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 4195 

I I I I I I I II II I I I I I I I I I I I I I I 

Db 3631 AACAGGCGGGCCTTCGGGGACAAGCAGAGCTGTCTTCGCCCGTTCACTGAAGATGATGCT 3690 

Qy 4196 GCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCA 4255 

I I I I I I I I I I I I 

Db 3691 GCTG ATCCAAATGATTCT 3708 

Qy 4256 G AC AAT GT CAG C C T G CAAG AG GT G GAG G CAG AG GCCCTGTC GAG G GT C G G C CAG G G CAG C 4315 

I I I I I III II I I II I I I I I I I 

Db 3709 GACGT AGACCCAGAAT CCAGAGAGACAGACTT GCT CAGT GGGAT GGAT GGCAAAGGGT C C 3768 

Qy 4316 CGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGC 4375 

I I I I I I I I I I I III II I I I I I I I I I I Ml 

Db 3769 TACCAGGTGAAAGGCTGGAAACTTACACAGCAACAGTTTGTGGCCCTTTTGTGGAAGAGA 382 8 

Qy 437 6 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 4435 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3829 CTGCTAATTGCCAGACGGAGTCGGAAAGGATTTTTTGCTCAGATTGTCTTGCCAGCTGTG 388 8 

Qy 4436 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 44 95 

I I I I I II I I I I I I I I I I I Mill II I I I III 

Db 3889 TTTGTCTGCATTGCCCTTGTGTTCAGCCTGATCGTGCCACCCTTTGGCAAGTACCCCAGC 3948 

Qy 449 6 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 4555 

MUM III II II I I I I II II I I 

Db 3949 CTGGAACTTCAGCCCTGGATGT ACAAC GAACAGT ACACATTT GT C AGNNNNNNNNNN 4005 

Qy 4556 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 4 615 



Db 



400 6 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4065 



Qy 4 616 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 4 675 

Db 4066 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4125 

Qy 4676 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 4735 

Db 412 6 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 418 5 

Qy 4736 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 47 95 

Db 418 6 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 4245 

Qy 47 96 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 4 855 

I I I I I I 

Db 42 4 6 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNAGAAAACAAAACACTGCAGAT 43 05 

Qy 4 8 56 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 4 915 

I I I I I 1 I I I I I II II I I I I I I I 

Db 4306 AT C CT T C AGGAC CT GAC GG GAAG AAAC AT T T C GGATT AT CT GGT GAAGAC GT AT 435 9 

Qy 4916 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 4 975 

II III I I I I III I I I I I I I 

Db 4360 GT GC AGAT CAT AG C CAAAAGC T T AAAGAAC AAGAT CT G GGT GAAT GAGT TT AG GT AT G G- 4418 

Qy 4976 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 5035 

I I I I I I I I I I I I I I I I I I I I I III 

Db 4419 --CGGCTTTTCCCTGGGTGTCAGTAATACTCAAGCACTTCCTCCGAGTCAAGAAGTTAAT 4476 

Qy 503 6 G GC GAC AT C CT GAC C GAC AT CAC C GG C C AC AAT GT C T CT G AGT AC CT GCT CTT C AC C T C C 5095 

I I I I I I II I I I I I I I I I I 
Db 4 4 77 GAT GCCAT CAAACAAAT GAAGAAACACCTAAAGCT GGC CAAGGAC 4521 

Qy 5096 GACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATC 5155 

Db 4522 AGTTCT 4527 

Qy 5156 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 5215 

III ; I I I I I I I I I III II I I 

Db 4528 GCAGAT C GAT T T CT CAAC AG CT T GGGAAGAT T TAT GAC AGGACT G GAC AC CAAAAAT AAT 4587 

Qy 5216 GCC CAGGT T T T CT ACAACAACAAGGGCT AT C ACAG CAT G C C CAC CT AC CT CAAC AG CC T C 5275 

I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I III 

Db 458 8 GTCAAGGTGTGGTTCAATAACAAGGGCTGGCATGCAATCAGCTCTTTCCTGAATGTCATC 4 647 

Qy 5276 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 5335 

I II I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 4 648 AACAATGCCATTCTCCGGGCTAACCTGCAAAAGGGAGAG AACCCTAGCCATTATGGA 4704 

Qy 5336 AT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC C AG C G C C AG CCTCTCCCTG GAT T AC C T G 5395 

I I I I I I I I I I I I I I I II I I I I I I I I I I II III 

Db 4705 AT TACT GC T T T CAAT CAT C C C CT GAAT CT CAC CAAG CAG C AG CT CT C AGAGGT GG C T CT G 4764 

5396 CTGCAGGGCAC GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTG 5452 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 

47 65 ATGACCACATCAGTGGATGTCCTTGTGTCCATCTGTGTCATCTTTGCAATGTCCTTCGTC 4824 



Qy 

Db 



Qy 5453 CCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAG 5512 

I I I I I I I II I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I 

Db 4825 C C AGC C AG CT T T GT T GT AT T C CT GAT C CAG GAG C GG GT CAGCAAAGCAAAAC AC C T G CAG 4884 

Qy 5513 TTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTC 5572 

II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 

Db 4885 TTCATCAGTGGAGTGAAGCCTGTCATCTACTGGCTCTCTAATTTTGTCTGGGATATGTGC 4 944 

Qy 5573 AACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCC 5632 

II III I Mill II II I I I I I I I I I I I I I I I III 

Db 4 945 AAT T AC GTTGTCCCTGC C AC AC T NN T CAT TAT CAT C T T CAT C T G C T T C CAG C AG AAGT C C 5004 

Qy 5633 TACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCC 5692 

II III II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 5005 TATGTGTCCTCCACCAATCTGCCTGTGCTAGCCCTTCTACTTTTGCTGTATGGGTGGTCA 5064 

Qy 5693 ATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTG 5752 

I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 5065 ATCACACCTCTCATGTACCCAGCCTCCTTTGTGTTCAAGATCCCCAGCACAGCCTATGTC 5124 

Qy 5753 TTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTA 5812 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 5125 GTGCTCACCAGCGTGAACCTCTTCATTGGCATTAATGGCAGCGTGGCCACCTTTGTGCTG 5184 

Qy 5813 CAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTC 5872 

I I I I I I I I II I I I I I I I I I I I I I I I MINI III 

Db 518 5 GAGCTGTTC AC C GAC AAT AAG C T GAAT AATAT CAAT GAT AT C CT GAAGT C T GT GTT C 5241 

Qy 5873 C T CAT T T T C CC CAACT ACAAC CT GG GC C AC GG GCT CAT GGAGAT G G C C T ACAACGAGTAC 5932 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 5242 T T GAT C T T C C CACAT TTTTGCCT GGGAC GAG GGCT CAT CGAC AT G GT GAAAAAC CAGGC A 5301 

Qy 5933 AT CAAC GAGT ACT AC GC CAAGAT T GGC C AGT T T GACAAGAT GAAGT CCCCGTTC GAGT GG 5992 

II II I I I I I I 

Db 5302 ATGGCTGATGNNNTGGAAAGGTTTGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5361 

Qy 5993 GACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTG 6052 

Db 5362 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN 5421 

Qy 6053 ACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAG 6112 

II III I 

Db 5422 NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNACCTGTAAATGCAAAGCTACCTCCT 54 81 

Qy 6113 CCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCC 6172 

I I I I I I I I I I I I I I III I III II I II III II 

Db 5482 C T GAAT GAT GAAGAT GAAG AT GT GAGG C G G GAAAGAC AGAGAAT T CT T GAT GGT G GAGG C 5541 

Qy 6173 GAC AAT GAC AT GGT CAAGAT T G AG AAC C T GAC C AAG GT C T AC AAGT C C C G GAAGAT T G G C 6232 

I I I I I I I I I III III I I I I I I I I I I I I 

Db 5542 CAGAAT GAT AT CT T AGAAAT CAAGGAGT T GAC GAAGAT AT A TAGAAGGAAG 5592 

Qy 6233 CGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTC 62 92 

I I I I I I I II I I I I I II I I I I I I I I II I II I I I I I I I I I I I I I I 
Db 5593 CGGAAGCCTGCTGTTGACAGGATTTGCGTGGGCATTCCTCCTGGTGAGTGCTTTGGGCTC 5652 

Qy 6293 CTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGC 6352 



Db 5653 C T GG GAGT TAAT GGGGCTG GAAAAT CAT CNN CT T T CAAGAT GT TAACAG G AGAT AC C ACT 5712 

Qy 6353 ACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTG 6412 

II I I I I I I I I I I I I II III III 

Db 5713 GT T AC CNN AG GAG AT GCTTTCCT T AAC AANNNNNN T AT CT TAT C AAAC AT C CAT G AAGT A 5772 

Qy 6413 CAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGG 6472 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 

Db 57 73 CATCAGAACAT GGGCTACT GCCCTCAGT TT GAT GC CAT CACAGAGCT GTT GACT GGGAGA 5832 

Qy 647 3 GAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTG 6532 

I I I I I I I I I I I II I I I I I III I I I I I I II III 
Db 5833 GAACACGTGGAGTTCTTTGCCCTTTTGAGAGGAGTCCCAGAGAAAGAAGTTGGCAAGGTT 5892 

Qy 6533 GTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACC 6592 

I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I 

Db 58 93 GGTGAGTGGGCGATTCGGAAACTGGGCCTCGTGAAGTATGGAGAAAAATATGCTGGTAAC 5952 

Qy 6593 TACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCC 6652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 5953 TATAGTGGAGGCAACAAACGCAAGCTCTCTACAGCCATGGCTTTGATCGGCGGGCCTCCT 6012 

Qy 6653 TTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGG 6712 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I III 
Db 6013 GTGGTGTTTCTGGATGAACCCACCACAGGCATGGATCCCAAAGCCCGGCGGTTCTTGTGG 6072 

Qy 6713 AAC CT CAT C CT C GACC T CAT C AAGAC AGGGC GT T CAGT GGT GCT GACAT C AC ACAG CAT G 6772 

II III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6073 AATTGTGCCCTAAGTGTTGTCAAGGAGGGGAGATCAGTAGTGCTTACATCTCATAGTATG 6132 

Qy 6773 GAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGC 6832 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6133 GAAGAAT GT GAAGCT CT T T GC ACT AGGAT GGCAAT CAT GGT CAAT GGAAG GT T CAGGT GC 6192 

Qy 6833 CTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTGCGG 6892 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I 

Db 6193 CTTGGCAGTGTCCAGCATCTAAAAAATAGGTTTGGAGATGGTTATACAATAGTTGTACGA 6252 

Qy 6893 A C CAAG AGC AG CC AGAGT GT GAAGGAC GT GGTGCGGTTCTT CAAC C GCAACT T C CC G 6949 

I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 6253 ATAGCAGGGTCCAACCCGGACCTGAAGCCTGTCCAGGATTTCTTTGGACTTGCATTTCCT 6312 

Qy 6950 G AAG C CAT GCT CAAG GAG C G G C AC C AC AC AAAG GT G C A G T AC C AG C T C AAGT C G GAG C AC 7009 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6313 G GAAGT GTT CT AAAAGAGAAAC AC C GGAAC AT GCT ACAAT AC C AGCT T C CAT C T T CATT A 6372 

Qy 7010 ATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAG 7069 

I I I I I I I I I I I I I I I I I I III II I I I I I 

Db 6373 TCTTCTCT G GC C AGGAT AT T C AG CAT CC T CT C C C AGAGCAAAAAGCGACT CC ACAT AGAA 6432 

Qy 707 0 GACT ACT C G GT C AGC C AG AC C AC ACT GGACAAT GT GTT C GT GAACTT T GC C AAGAAG C AG 712 9 

I I I I I I I I II I I I I I I I I I I III I II II II I I I I I I I I I I I I I I II 

Db 6433 GACTACTCTGTTTCTCAGACAACACTTGACCAAGTATTTGTGAACTTTGCCAAGGACCAA 6492 

Qy 7130 AGTGA 7134 

I I I I I 



Db 



64 93 AGTGA 64 97 
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ORIGIN 



BX341657 1045 bp mRNA linear EST 01-MAY-2003 

BX341657 Homo sapiens HELA CELLS COT 2 5 -NORMALIZED Homo sapiens 
cDNA clone CS0DK003YD11 5-PRIME, mRNA sequence. 
BX341657 

BX341657. 1 GI: 30313005 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1045) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies , a division of 
Invitrogen. This sequence belongs to sequence cluster 5334. f For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DK003CB06QPl&cluster=5334 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DK003CB06QP1 . 

Location/Qualifiers 

1. .1045 

/organism="Homo sapiens" 
/mol_type= ,, mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DK003YDll" 

/cell_type="HELA CELLS COT 25-NORMALIZED" 
/cell_line="HELA" 

/clone_lib="Homo sapiens HELA CELLS COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



Query Match 11.5%; Score 923.2; DB 13; Length 1045; 

Best Local Similarity 95.3%; Pred. No. 6.5e-133; 

Matches 955; Conservative 23; Mismatches 21; Indels 3; Gaps 3; 

Qy 907 GGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGACTCCTC 966 

Ml Ml I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 41 GTACCGGTCCGGAATTCCCGGGATGCTGGGCCTGGATGCCCCCAACGGCTCGGACTCCTC 100 

Qy 9 67 GCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATGCCCA 1026 

I I I I I I I I : M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 101 GCCACAGG-SCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATGCCCA 159 



Qy 1027 GAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGGGTGC 1086 

I I I I M II I I I I I I I I I I I I I I I I I I I | | | | | || | | I I | | | M I II I I I t I I I I I 

Db 160 GAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGGGTGC 219 

QY 1087 CTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATGGCAC 114 6 

M I I I I I I I I I I I I I I I I I I M I I I I I I I I | | | | | | | | | | I I I I I I I I ! I I I I I I I I I I I 

Db 22 0 CTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATGGCAC 27 9 

QY H47 TGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTGCTGC 120 6 

I I I I I I I I I I II II I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | f | | | | | | | | | 
Db 28 0 TGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTGCTGC 33 9 

Qy 1207 AGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCTGGGC 12 66 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | II I I I I I I II I I I I I I I II I I I I 
Db 340 AGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCTGGGC 39 9 

Qy 12 67 CGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGCGGCG 132 6 

I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | 
Db 4 00 CGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGCGGCG 459 

Qy 1327 GGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCCTCGT 1386 

I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 60 GGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCCTCGT 519 

Qy 1387 GCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCGACCG 144 6 

I I I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I 

Db 520 GCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCGACCG 57 9 

Qy 144 7 C GT CAT C CT CAAG GC C AAC GAGACT T TT GCT TT T GT GGGCAAC GT GACT C AC T AT GC C C A 1506 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I || I | | | | | | 
Db 580 CGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATGCCCA 639 

Qy 1^07 GGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCA 1566 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64 0 GGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCA 699 

Qy 1567 ACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCACTGAA 1626 

I I I I I I I I M I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 700 ACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCACTGAA 759 

Qy 162 7 CCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGG 1686 

I I I I I I I : I I II :: I I I I I I I I I I I I I I I I I I I I I I : I II I I : I I I I M I I I I I I I III 
Db 760 CCTGTCAMTGGAWRAGCTGCCGCCGGCCCTGAGACARGACAAMTTCTCGCTGCCCAATGG 819 

Qy 1687 CATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCCAGTT 174 6 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I II 
Db 82 0 CAT GGCCCTCCT GC AG CAG CT G GAT AC CATT GACAAC GC GGCCTG-G G CT GGAT C C AAT T 878 

Qy 1747 CAT GT CCAAGGT GAGCGTGGACAT CTTCAAGGGCTT CC CCGACGAGGAGAGCATT GT CAA 1806 

I I I I I M I II I I I I I I I I I I I I I I I I I I I I : I I : I M I I I I I I I I I I II I I I I I I : I : I I 
Db 879 CAT GT CC AAG GT GAG C GT GGAC AT CT T CAARGG S T T C C C C GAC GAG GAGAG CAT T RTMAA 938 

Qy 18 07 CTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGATCTTCCA 1866 

: I I M I I I I I I I I : I I I I I : II I I I I I I : II I I I I I I I I I I :: I I I I I I I I I I : I I I I 
Db 939 MT AAAC C C T C AAAC ARG C C T AMC AG GAC AAMGT C AC TGTTTTTKS C AGT GT GAT C WT C C A 998 



Qy 18 67 GACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAA 1908 

I I I I I I I : II I I I : I I I : I I I : I I I I I I I I I I I I : I I : 
Db 999 AAACCGGAARGACGGSTCGMTCCSG-CTCACGTGCACWAAAR 1039 
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BM548310 1078 bp mRNA linear EST 20-FEB-2002 

AGENCOURT_6571362 NIH_MGC_124 Homo sapiens cDNA clone IMAGE : 5734035 
5 ! , mRNA sequence. 
BM54 8310 

BM54 8310. 1 GI: 187 82778 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 1078) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Robert Strausberg, Ph.D. 

Email: cgapbs~r@mail.nih.gov 

Tissue Procurement: Invitrogen 
cDNA Library Preparation: Life Technologies r Inc. 
cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 
DNA Sequencing by: Agencourt Bioscience Corporation 
CI one distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : //image . llnl . gov 

Plate: LLAM12738 row: 1 column: 04 

High quality sequence stop: 667. 
Location/Qualifiers 
1. .1078 

/organism= f, Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone="IMAGE: 5734035" 
/tissue_type="hippocampus" 
/lab_host-"DH10B" 
/clone_lib="NIH_MGC_12 4" 

/note="Organ: brain; Vector: pCMV-SPORT6; Site_l: EcoRV 
(destroyed); Site_2 : NotI; RNA source male hippocampus, 
age 27. Library is oligo-dT primed and directionally 
cloned (EcoRV site is destroyed upon cloning) . Average 
insert size 1.4 kb, insert size range 0.9-4 kb . Library 
normalized and enriched for full-length clones and was 
constructed by C. Gruber (Invitrogen) . Research Genetics 
tracking code 012." 



is 



ORIGIN 



Query Match 11.2%; Score 901.4; DB 12; Length 1078; 

Best Local Similarity 97.4%; Pred. No. 1.6e-129; 

Matches 959; Conservative 0; Mismatches 21; Indels 5; Gaps 



4; 



Qy 



7 CGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGCTGCT 66 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II II I I I I I 



Db 21 CGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGCTGCT 80 

Qy 67 CTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCTTCAT 126 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I | I I I 
Db 81 CTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCTTCAT 14 0 

Qy 127 CCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCTCCGT 186 

I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 141 CCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCTCCGT 200 

Qy 187 GAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTGTCAT 24 6 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 201 GAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTGTCAT 260 

Qy 247 GCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCAACTC 306 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I 
Db 2 61 GCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCAACTC 32 0 

Qy 307 CACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGTTTGA 366 

I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 321 CACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGTTTGA 380 

Qy 367 CCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGGCCCT 426 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 381 CCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGGCCCT 440 

Qy 427 CAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCTTCTC 48 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 441 CAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCTTCTC 500 

Qy 487 TCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACTTGTC 54 6 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 501 TCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGC7\AAACTTGTC 560 

Qy 547 GCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGGTCTA 606 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 561 GCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGGTCTA 62 0 

Qy 607 CCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGGGTCA 666 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 621 CCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGGGTCA 680 

Qy 667 GGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGCTGGC 726 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 681 GGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGCTGGC 74 0 

Qy 727 TCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGATCCT 786 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I 

Db 741 TCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGATCCT 8 00 

Qy 7 87 CACTGTGCCTGAGAGTCAGi\AGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCAGTGG 846 

II I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 801 CACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCAGTGG 860 

Qy 847 GCAGGCTGCTGCGCGTGCCAGGCGCTTCTCT-GGGCTGTCTGCTGAGCTCCG-GAACCAG 904 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 
Db 861 GCAGGGTGCTGCGCGTGCCAGGCGCTTCTCTGGGGCTGTCTGCTGAGCTCCGCGAACCAC 920 



Qy 905 CTGGACGTGGCC-AAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCT — CGGAC 961 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II | | | | 
Db 92 1 CTGAACGGGGCCAAAGGCCTCCCACCACCTGGGCCTGGATGCCCCCCAACGGTTCGGGAC 980 

Qy 962 TCCTCGCCACAGGCGCCACCCCCAC 98 6 

I I I I I I I I I III I II I I 
Db 981 TCCTCCCCACCAGGGGCCACCCCCC 1005 
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BX374888 

LOCUS 

DEFINITION 
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KEYWORDS 
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TITLE 
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FEATURES 

source 



ORIGIN 



BX374888 1201 bp mRNA linear EST 08-MAY-2003 

BX374888 Homo sapiens NEUROBLASTOMA COT 2 5 -NORMALIZED Homo sapiens 
cDNA clone CS0DC004YF05 5-PRIME, mRNA sequence. 
BX374888 

BX374888. 1 GI:30448362 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1201) 

Li,W.B., Gruber,C, Jessee, J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 5334. f For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster.cgi?seq=CSODC004CC03QPl&cluster=5334.f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DC004CC03QP1 . 

Location/Qualifiers 

1. .1201 

/organism="Homo sapiens" 
/ mol_t ype= "mRNA" 
/db_xref="taxon: 9606" 
/clone="CS0DC004YF05" 

/ tissue_type="NEUROBLASTOMA COT 2 5 -NORMAL I ZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



Query Match 11.2%; Score 901.4; DB 13; Length 1201; 

Best Local Similarity 91.9%; Pred. No. 1.6e-129; 
Matches 971; Conservative 30; Mismatches 46; Indels 



10; Gaps 



5; 



Qy 4834 CTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGC 4893 



Db 


65 


Qy 


4894 


Db 


125 


Qy 


4954 


Db 


185 


Qy 


5014 


Db 


245 


Qy 


5074 


Db 


304 


Qy 


5134 


Db 


364 


Qy 


5194 


Db 


424 


Qy 


5254 


Db 


484 


Qy 


5314 


Db 


544 


Qy 


5374 


Db 


604 


Qy 


5434 


Db 


664 


Qy 


5494 


Db 


724 


Qy 


5554 


Db 


784 


Qy 


5614 


Db 


844 


Qy 


5674 



I I I I M I I I I I II I I I I I I I II II I I I II I I I I I I I I : I I I | | | | | | | | | | | | | | | | | | | 
CTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGRACGTCTCCCTGCCGCCCACCGC 124 

TGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCG 4 953 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I | | | I | | | | 
TGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCG 184 

CTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCC 5013 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I II 
CTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCC 244 

GCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGACATCACCGGCCACAATGTCTC 5073 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | | | | | | | | 

G- C C C AGAT G C G G GT GGT CAC AGGC GAC AT C C T GAC C GAC AT C ACC GG C CAC AAT GT CT C 303 

TGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTT 5133 
I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I : I I I I | | | | | 
TKAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGSCATCACCTT 363 

TGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCG 5193 

I I h I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGGRAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCG 423 

GAAGAT C G C GGT GC G CAGGGCT G C C C AGGT TT T C TACAACAACAAG GG C TAT CAC AGC AT 5253 
I I I I I I I I I I I : I I I I I II I : I I I I I I I I I I I M I I I I I I I I I I I I I I : I I I I I I I I I I I 
GAAGATCGCGGKGCGCAGGGSTGCCCAGGTTTTCTACAACAACAAGGGSTATCACAGCAT 4 83 

GCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAA 5313 

I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I | | II I I I I I I I I II I 

GCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAA 543 

G G GCAAC CCGGC G GCTT AC GG C AT CAC C GT C ACCAAC CAC C C CAT GAATAAG AC C AGC G C 5373 

I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

GG GCAAC C C GG CGGC TT AC GGC AT CAC C GT CACCAACCAC C C CAT T GAAT AAGAC CAGC G 603 

CAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCAT 5433 
I ' I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I : I I I : I I I I I M I I I I I I I I I I I I I 
CCASCTCTCCCTGGATTACCTGCTGCAGGGCACGGRTGTYGTCATCGCCATCTTCATCAT 663 

CGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCAC 5493 
I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCAC 723 

CAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAA 5553 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : | | | | | | | || | | | | | | | | | | | || I I I 
CAAGGCCAAGCACCTGCAGTTTGTCAGCGGCTGCRACCCCATCATCTACTGGCTGGCGAA 783 

CTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTT 5613 

M I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I : I I I I I 111:111111111 

CTACGTGTGGGACAWGCTCAACTACCTGGTCCCCGCYACCTGCTGTGTCAWCATCCTGTT 843 

TGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTT 567 3 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTT 903 

CCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGT 5733 
I I I : I I I I I I I I I M : I I I I I I : I I I I I I I II I I I I : I I I I I : I I I I I I I 



Db 



904 TTTTCTYTATGGGTGG-GCAWCACGCCCATCAWGTACCCGGCCTCCYTCTGGKTCGAGGT 962 



Qy 5734 CCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCAC 5793 

M I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I II I I I I II I : I I I I I I I Ml 
Db 963 CCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGSATCACCG-CAC 1021 

QY 5794 CGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTG7UVGGTTGTCAACAG 5853 

M I I I M I I : I I I :: I : II :| || | | Ill :| :| 

Db 1022 CGTGGCCACYTTCYKGYACAGMCTTCGASACGAC AAGGACTGAAGGTGKTAMA 1074 

Qy 5854 TTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTAC 58 90 

I I I I I I I I I I : I I II I I I I I I : I I : I 

Db 1075 GTGACTGAAAAGCKGCTTCTCATTTTCCCAMTACAMC 1111 



RESULT 11 
AL525194 

LOCUS AL525194 964 bp mRNA linear EST 22-MAY-2003 

DEFINITION AL525194 Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED Homo sapiens 

cDNA clone CS0DC005YF02 5-PRIME, mRNA sequence. 
ACCESSION AL525194 

VERSION AL525194.2 GI:31043449 

KEYWORDS EST. 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 (bases 1 to 964) 

AUTHORS Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
TITLE Full-length cDNA libraries and normalization 

JOURNAL Unpublished (2001) 
COMMENT On Feb 13, 2001 this sequence version replaced gi: 12788687. 

Contact : Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 5334. f For 
more information about this cluster, see 
http: / /www. genoscope. ens . f r/ 

cgi-bin/cluster . cgi?seq=CSODC005DC01QPl&cluster=5334 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DC005DC01QP1 . 
FEATURES Location/Qualifiers 
source 1. .964 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xre f = " t axon : 9 6 0 6 " 
/clone="CS0DC005YF02" 

/tissue_type="NEUROBLASTOMA COT 25-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT ) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 11.2%; Score 900.4; DB 9; Length 964; 

Best Local Similarity 99.2%; Pred. No. 2.2e-129; 

Matches 915; Conservative 0; Mismatches 6; Indels 1; Gaps 1; 

Qy 57 84 T C AC C G C C AC C GT G G C C AC C T T C C T G C T AC AG C T C T T C GAG C A C G AC AAG G AC C T G AAG G 5843 

II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I | I I | I I I I I I I I I 
Db 44 TCCCGGGATCCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGG 103 

Qy 5844 TTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACG 5903 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 
Db 104 TTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACG 163 

Qy 5904 GGCT CAT GGAGAT G G C CT ACAAC GAGT AC AT C AAC GAGT AC T AC GC CAAGAT T G G C C AGT 5963 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 164 GGCTCATGGAGATGGCCTACAACGAGTACATCAACGAGTACTACGCCAAGATTGGCCAGT 223 

Qy 5964 T T GACAAGAT GAAGT C C C C GT T C GAGT GGGACATT GT C AC C C G CG GACT GGT GGC CAT GG 6023 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 224 TT GACAAGAT GAAGT C C C C GT T C GAGT GG GACAT T GT C AC C C GC GGAC T GGT GG C CAT G G 2 83 

Qy 6024 CGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGC 6083 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2 84 CGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGC 343 

Qy 6084 GGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTG 6143 

I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 344 GGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTG 403 

Qy 6144 AG C G G C AGC GAGT G CT C C GGGGAGAC GC C GACAAT GACAT G GT CAAGAT T GAGAAC CT GA 6203 

I I I I II I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I II I I I I 
Db 4 04 AGC GGCAGCAAGTGCT C C GGGGAGAC GCC GACAAT GACAT GGT CAAGATT GAGAACCTGA 4 63 

Qy 6204 CCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGG 6263 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 464 CCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGG 523 

Qy 6264 GTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCA 6323 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 524 GTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCA 583 

Qy 6324 CCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGAC 6383 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 584 C CT T CAAGAT GCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAAT GGAC 643 

Qy 6384 ACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTG 6443 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64 4 ACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTG 703 

Qy 644 4 ACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTG 6503 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I 
Db 7 04 ACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTG 763 

Qy 6504 GGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGA 6563 

I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 64 GGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGA 823 



Qy 6564 CCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCA 6623 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I II I I I I I | I I I I I I I 
Db 824 CCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAA-CTCTCCA 8 82 

Qy 6624 CGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCA 6683 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 83 CGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCA 942 

Qy 6684 TGGACCCCAAGGCCCGGCGCTT 6705 

I I I I I I I I I I I I I I I I I I I I I I 
Db 943 TGGACCCCAAGGCCCGGCGCTT 964 



RESULT 12 

AL525193/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



ORIGIN 



AL525193 958 bp mRNA linear EST 22-MAY-2003 

AL525193 Homo sapiens NEUROBLASTOMA COT 2 5 -NORMALIZED Homo sapiens 
cDNA clone CSODC005YF02 3-PRIME, mRNA sequence. 
AL525193 

AL525193.2 GI : 31043448 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 958) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On Feb 13, 2001 this sequence version replaced gi: 12788686. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 5334. f For 
more information about this cluster, see 
http : //www. genoscope. ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DCO05DC01NPl&cluster=5334 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DC005DC01NP1 . 

Location/ Qualifiers 

1. .958 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref ="taxon : 9606" 
/clone="CS0DC005YF02" 

/ t is sue_type= "NEUROBLASTOMA COT 25-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 25-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 
sites of the pCMVSPORT 6 vector. Library was normalized." 



Query Match 



11.1%; Score 893.2; DB 9; Length 958; 



Best Local Similarity 97.9%; Pred. No. 2.8e-128; 

Matches 923; Conservative 12; Mismatches 5; Indels 3; Gaps 3; 



Qy 7050 CTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTCG 7109 

: I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II I I I 
Db 958 YTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTCG 899 

Qy 7110 T GAAC T T T G C CAAGAAG CAGAGT GACAAC CT G GAG C AGC AG GAGAC GGAG C C GC CAT C C G 7169 

I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II 
Db 8 98 T GAAC T T T G C CAAGAAGCAGAGT GACAAC CT G GAGC AGCAGGAGAC G GAGC CGC C AT C C G 839 

Qy 717 0 CACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGG 7229 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 838 CACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGG 779 

Qy 7230 AGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCA 728 9 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 778 AGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCA 719 

Qy 7290 TCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCAC 7349 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 
Db 718 T C AGCT T C GAGGAG GAG CGGG C C C AG CT GT C C T T CAAC AC G GACAC G CT CT GCT GAC C AC 659 

Qy 7350 C CAGAGCT GGGCCAGGGAGGACAC GCT C CACTGAC CACCCAGAGCT GGGCCAGGGACT CA 7409 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 658 C CAGAGCT GGGCCAGGGAGGACAC GCTC CACT GAC CACC CAGAGCT GGGCCAGGGACT CA 599 

Qy 7410 ACAAT G G GGAC AGAAGT C C CC CAGT G C CT G C CAGGGC CT GGAGT GGAG GT T C AGGAC CAA 7469 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 598 ACAAT GG G GAC AGAAGT C C CC C AGT GC CT G C C AG G GC CT G GAGT G GAGGTT C AGGAC CAA 539 

Qy 7470 GGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCG 752 9 

I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 538 GGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGTGGTCACTGCGGTTGCCG 479 

Qy 7530 CCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGC 758 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 478 CCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGC 419 

Qy 7 590 CTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAG 764 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 418 CTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAG 359 

Qy 7650 GCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTT 77 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 358 GCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTT 299 

Qy 7710 TTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCC 7769 

I I I I : I I M I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I : I I I 
Db 298 TTCTHTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAKTCC 239 

Qy 777 0 CGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGC 7829 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 238 CGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGC 179 

Qy 783 0 TGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGA 7889 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I : I I I II I I I I I I I I I I I I I I I I I I I I I I I I 



Db 17 8 TGT-CTGCGGGAAGCCATCAGCTTGGGCCARCTGGCAGGTGGCAGGAATGGAGAAGCTGA 120 

Qy 7 890 CCCTGCTGGCCAGGCAAGGGGCCAGACC-CCCCCCAACCCCCAGCTGCCATCGCTCTCCC 794 8 

I I I I I I I I II I I I II I I I I I I : I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 119 CCCTGNTGGCCAGGCAAGGGGCSAGACCGCCCCCCAACCCCCAGCTGCCATCGCTCTCCC 60 

Qy 7 94 9 ACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGG 7991 

I I I I I I I I I I I I I I I I I I I I 11:11111111 Ml:::::: 
Db 59 ACCCAGCTT-GCCCCCTGCCCACCMACCTCCCTTGGADMMDDK 18 



RESULT 13 

AL540221/C 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



AL540221 1201 bp mRNA linear EST 31-MAY-2003 

AL540221 Homo sapiens FETAL BRAIN Homo sapiens cDNA clone 
CS0DF032YO04 3-PRIME, mRNA sequence. 
AL540221 

AL540221.2 GI:31264782 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1201) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 

On Feb 15, 2001 this sequence version replaced gi: 12870176. 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 

was not normalized. Library was constructed by Life Technologies, a 

division of Invitrogen. This sequence belongs to sequence cluster 

5334. f For more information about this cluster, see 

http : //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DF032BH02NPl&cluster=5334 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DF032BH02NP1 . 

Location/Qualifiers 

1. .1201 

/organism= n Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone= ,, CS0DF032YO04 ,, 
/tissue_type="FETAL BRAIN" 
/dev_s tage=" fetal " 

/clone_lib="Homo sapiens FETAL BRAIN" 

/note="0rgan: brain; Vector: pCMVSPORT_6; 1st strand cDNA 
was primed with a Notl-oligo (dT) primer. Five prime end 
enriched, double-strand cDNA was digested with Not I and 
cloned into the Not I and EcoRV sites of the pCMVSPORT 6 
vector. Library was not normalized." 



ORIGIN 



Query Match 



11.0%; Score 886.2; DB 9; Length 1201; 



Best Local Similarity 95.1%; Pred. No. 3.7e-127; 

Matches 959; Conservative 16; Mismatches 25; Indels 8; Gaps 6; 



Qy 7 006 GCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCAT 7 065 

hill I I I I I I II : I : I I I I I I I I I I I I I I I : I I I I I I I I I I I I I 

Db 1003 GSACACATTTGGTTGCCCAGGTTTCASCMAGATGGAGCAGGTGTYTGGCGTG-TTGGCAT 945 

Qy 7066 CGAGGACTACT CGGT CAGC CAGAC CACACT GGACAAT GT GT T C GT GAACTT T GC CAAGAA 7125 

: I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I II I I II I 1 I I I I 
Db 944 S GAG GACT ACT C - GT C AG C CAGAC CACACT GGACAAT GT GT T C GT - AAC T TT GC CAAGAA 8 87 

Qy 7126 G C AG AGT G AC AAC C T G GAG C AG C AG GAG AC G GAG C C G C CAT C C G C AC T G C AG TCCCCTCT 7185 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 886 G C AGAGT GACAAC CT GGAGC AGC AGGAGAC G GAGC C G C CAT C C GCAC T GC AGT C C C CT CT 827 

Qy 7186 CGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGT 7245 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 826 CGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGT 767 

Qy 7246 GGCAGACGAGC C CGAGGACCT GGACACGGAGGACGAGGGC CTCAT CAGCTT C GAGGAGGA 7305 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 766 GG CAGAC GAG C C C GAGGAC CT G GAC ACG GAG GAC GAG GGC CT CAT C AG CT T C GAGGAGGA 7 07 

Qy 7306 GCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGG 7365 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 06 GCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGG 647 

Qy 7366 GAGGACACGCTCCACT GAC CACCCAGAGCT GGGCCAGGGACT CAACAAT GGGGACAGAAG 7425 

I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I : II I I I I I 
Db 64 6 GAGGACACG CT C CACT G AC C AC C C AGAGCT G G GC CAG GGAC T CAACAAT GGGRAC AGAAG 5 87 

Qy 7426 TCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTC 74 85 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I : I I I I I I I I I I I I I 
Db 58 6 TCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGRGCTTCTGGTCCTC 527 

Qy 7486 CAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAA 7545 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II ! I I I 
Db 526 CAGCCCCTGTACTCGGCCATG-CCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAA 4 68 

Qy 7546 AGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGT 7605 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 4 67 AGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGT 4 08 

Qy 7606 CTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGAC 7665 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 07 CTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGAC 34 8 

Qy 7 666 CAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGA 7725 

I I I I I I I I I I I I : II I I II I I I I : I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 347 CAGGCACTGCTGSCCTTTCTCCTSCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGA 288 

Qy 7726 AGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTT 7785 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 287 AGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTT 228 

Qy 77 8 6 TGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCC 7 845 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 



Db 



227 TGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCC 168 



Qy 7 846 ATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 7 905 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I II I I i I I I I I I I I I I I 
Db 167 ATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 108 

Qy 7906 AGGGGCCAGACCCCCCCCAACCCCCAGCTGCCAT CGCTCTCCCACCCAGCTTGGCCC 7 962 

I II I II: : I I I I I I I II I I I I II : I I I I I I I I III I : I I I I : : I I I 

Db 107 AGGGCCCMCMCCCCCCCCAACCCCCMGCTGCCANTCGCTCTCCCMCCCACGCTCTSSCCC 4 8 

Qy 7963 CCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGA 8 010 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I II I I I I I I I I I I I I I 
Db 47 CCTGCCCGCCCACCTCCCTGGGAGCC-GGCSTGTACATAGCGCACAGA 1 
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BX420933 1082 bp mRNA linear EST 13-MAY-2003 

BX420933 Homo sapiens FETAL BRAIN Homo sapiens cDNA clone 
CS0DF036YI11 5-PRIME, mRNA sequence. 
BX420933 

BX420933. 1 GI: 30638255 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1082) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref @genoscope . ens . f r , Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies r a division of 
Invitrogen. This sequence belongs to sequence cluster 5334. f For 
more information about this cluster, see 
http : //www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DF036AE06QPl&cluster=5334 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DF036AE06QP1 . 

Location/Qualifiers 

1. .1082 

/organism="Homo sapiens 11 
/mol_type="mRNA M 
/db_xref= M taxon: 9606" 
/clone="CS0DF036YIll" 
/tissue_type="FETAL BRAIN" 
/dev_stage="fetal" 

/clone_lib="Homo sapiens FETAL BRAIN" 

/note="Organ: brain; Vector: pCMVSP0RT_6; 1st strand cDNA 
was primed with a Notl-oligo (dT) primer. Five prime end 
enriched, double-strand cDNA was digested with Not I and 
cloned into the Not I and EcoRV sites of the pCMVSPORT 6 
vector. Library was not normalized." 



ORIGIN 



Query Match 10.9%; Score 873.2; DB 13; Length 1082; 

Best Local Similarity 95.6%; Pred. No. 3.7e-125; 

Matches 937; Conservative 21; Mismatches 14; Indels 8; Gaps 6; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I II I I I I I I I I I I : I I I I I I I I I I ! I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I ! I 
Db 108 CCGCGGCGCTGAGGARGCGGA-CGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 166 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 167 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 226 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I : I I I I II I II 
Db 227 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAJ^GCCCACCAT 286 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 287 CTCCGTGAAGGAAG CCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 343 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

III I I I I I I I I I I I I II I II I I I I I I I I I I I : I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 344 TGTAATGCAATCGCTGTGCCCGGACGGCCAGCRAGACGAGTTCGGCTTCCTGCAGTACGC 4 03 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 404 CAACTCCACGGTCACGCAGCTGCTTGAACGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 4 63 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I II I I 
Db 464 GTTTAACCCAGCGCGGCCCAGCCTGGGCTCAAAGCTCGARGCCCTACGCCAGCATCTGGA 523 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 480 

I I II I I I I I : I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 524 GGCCCTCAATRCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 583 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 584 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCA-GAGCTCTGGCGTTTCCTGACGCAAAA 642 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

: I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 643 MTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTATGGACCCGCCCGA 702 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I I I I I I I I 1 I I I : I I I I I I I I I I II I I I I I I I I I I I I I I I I : I I I I I I I I II I I I I I I 
Db 703 AGTCTACCACCTGCWCTTTGGTCCCTCATCTGCCCTGGATTCAMAGTCTGGCCTCCACAA 7 62 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I : 1 I I I I I I II I I I I I I I I I 
Db 763 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTWCCGGATGGAGGAGCTGCT 822 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I 
Db 823 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGGGCTGGGSCG 882 



Qy 781 GATCCTCACTGTGCCTG-AGAGTCAGAAGGGAGCCCTGCAGGGCTA-CCGGGATGCTGTC 838 

I I : I I I I I I I I I I II I I I I I : I : I I I I : I I II I I I I I I I I I II I I I I : I I I I I I I I 
Db 8 83 GAWCCTCACTGTGCCTGAAAAATMARAAGGRAGCCCTGCAGGGCTACCCGGRATGCTGTC 942 

Qy 839 TGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGG 898 

I II I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I II 
Db 943 TGCAGTGGGCAGGCTGCTGCRCGTGCCAGGCGCTTCTCTRGGCTGTCTGCTGAGCTCCGG 1002 

Qy 899 AACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCG 958 

I I I I I I I I I I : I I I I I I I II II I I I I I : : I I I II I I I II I I I I M I M I I I I I I I I I I 
Db 1003 AACCAGCTGGRCGTGGCCAAGGTCTCCMM- CAGCTGGGGCTGGATGCCCCCAACGGCTCG 1061 

Qy 959 GACTCCTCGCCACAGGCGCC 978 

I I I I I I I I I I : I I I I III 
Db 1062 GACTCCTCGCMACAAGGGCC 1081 



RESULT 15 

BX376831 

LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 
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source 



BX376831 1201 bp mRNA linear EST 08-MAY-2003 

BX376831 Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED Homo sapiens 
cDNA clone CS0DD006YF01 5-PRIME, mRNA sequence. 
BX376831 

BX376831. 1 GI: 30458506 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
1 (bases 1 to 1201) 

Li,W.B., Gruber,C, Jessee,J. and Polayes,D. 
Full-length cDNA libraries and normalization 
Unpublished (2001) 
Contact: Genoscope 

Genoscope - Centre National de Sequencage 
BP 191 91006 EVRY cedex - France 

Email: seqref@genoscope.cns.fr, Web : www.genoscope.cns.fr 
Library was constructed by Life Technologies, a division of 
Invitrogen. This sequence belongs to sequence cluster 5334. f For 
more information about this cluster, see 
http : / /www. genoscope . ens . f r/ 

cgi-bin/cluster . cgi?seq=CS0DD006CC01QPl&cluster=5334 . f . Contact : 
Feng Liang Email : fliang@lifetech.com URL : 

http://fulllength.invitrogen.com/ InVitroGen Corporation 1600 
Faraday Avenue Genoscope sequence ID : CS0DD006CC01QP1 . 

Location/Qualifiers 

1. .1201 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon:9606" 
/clone="CS0DD0 06YF01" 

/ tissue_type="NEUROBLASTOMA COT 50-NORMALIZED" 
/clone_lib="Homo sapiens NEUROBLASTOMA COT 50-NORMALIZED" 
/note="lst strand cDNA was primed with a Notl-oligo (dT) 
primer. Five prime end enriched, double-strand cDNA was 
digested with Not I and cloned into the Not I and EcoR V 



sites of the pCMVSPORT 6 vector. Library was normalized." 

ORIGIN 



Query Match 10.6%; Score 854; DB 13; Length 1201; 

Best Local Similarity 84.3%; Pred. No. 3.7e-122; 

Matches 959; Conservative 90; Mismatches 76; Indels 12; Gaps 10; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I II I I I I I I I I II I I I I I I : II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I III 
Db 67 CCGCGGCGCTGAGGCGGCGGA-SGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCCGCT 125 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

I I I I I I I I I I : I I : : I I II I I I I I I I : I I I II I I I I I I I I I I I I I I I II I I I I I I I I : I 
Db 12 6 GCTGCTCTGGMAGMVCGTGACGCTCAMACGCCGGAGCCCGTGGGTCCTGGCCTTCGCGMT 185 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 186 CTTCMTCCCCCTGGTGCTGTCCTTTATCCTGCTGGGGCTGCGACAGACGAAGCCCACCAT 24 5 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I II I 
Db 24 6 CTCCGTGAAGGAAG CCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCMTCCTGCC 302 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III 
Db 3 03 TGTCATGCCATCGCTGTGCCCGGCCGGCCAGCGAGACGAGTTCGGCTTCCTGCCGTCCGC 362 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCA-ACC 359 

I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 363 CAACCCCACGGTCACGCCGCCGCCTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCACACC 422 

Qy 360 TGTTTGACCCA-GCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTG 418 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II : I I I I I 
Db 423 TGTTTGACCCACGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGMATCTG 4 82 

Qy 419 GAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCT 47 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I II I I I I I I I I I I I I I I I I : I : I 
Db 4 83 GAGGCCCTCAGTGCGGGCCCGGGCACCTMGGGGAGCCACCTGGACAGATTCACAGTKTYT 542 

Qy 479 TCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAA 538 

I I I I I I I I I I I I I I I I : I I II I I I II I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I 
Db 543 TCCTTCTCTCTGGACTYGGTGGCCAGAAACCCGCA-GAGCACTRGCGTTTCCTGACGCAA 601 

Qy 539 AACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCC 598 

I I : I I I I I I I : I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I : I I I I I I I I I I I 
Db 602 AAMTTGTCGCWGCMCAATAGCACGGCCCAAGCACTCTTGGCCGCMCGTDTGGACCCGCCC 661 

Qy 599 GAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCAC 658 

I I I I I I I I :: I I I I I I I I I I I I I I I I I I I I I I II I : I I I I I I I : I I I I I : I I : I I I I I I I 
Db 662 GAGGTCTAMMACCTGCTCTTTGGTCCCTCATCTGCMCTGGATTYACAGTYTGRCCTCCAC 721 

Qy 659 -AAGGGTCAGGAGCCCTGGAGCCGCCTA-GGGGGCAATCCCCTGTTCCGGATGGAGGAGC 716 

I I I I I I : I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I : I I I II I I I I II I II I I 
Db 722 AAAGGGTYAGGAGCCCTGGAGCCGCCTWGGGGGGCAATCCCCTKTTCCGGATGGAGGAGC 781 

Qy 717 TGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGG 77 6 

I I I I : : I I : I I I I I I I I I I I I I I I I I I I I I I I I I II : I I I I I I I : I I I I I I I I : : I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



782 AGCTGMWGGMTCCTGCCCACCTGGAGCAGCACACCTGCAMGCCGGGCWCGGGGGAGMWGG 841 



777 



842 



836 



902 



896 



962 



956 



GCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCT-ACCGGGATGCT 

II I I : I I : I I II I I II : I I I I : I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 
GCCGRATYCTCACTGTKCCTTARAATTAGAAGGGAGCCCTGCAGGGCTWACCGGGATGCT 

GTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTC 

II I : I I I I : I I I I I II I I I I I I I I I lllhlllll I I INI:: | : : | || I I 
GTTTKCAGTTRGCAGGCTGCTGCGCGTTCCAGRCGCTTTTWTTGGCTKWTTTMYGAGCCC 



835 



901 



895 



961 



955 



CGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGC 
I I II I I I I I I I I I I I I I : I I I I I I I I I I : I I I I I I I I I I I I I I II: I I I II I : I I 
CGGAACCAGCTGGACGTKGCCAAGGTCTYCCAGCAGCCGGGCCTTGAWTKCCCCAAMGGG 1021 



TCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTG 1015 
I : I I I : I I I : II : : III III : I I I : I II : I I I I I I : II : : I I I : II II I I : I 
1022 TYGGAMTTCTYGCMMAAGG-GCCCAMCCCMCGGRGGCTGCRGGGSYTTTTKGGGGACYTC 108 0 

1016 CTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTG 1075 

Mill : I I I I I I I MM: I : : I : I I II II II : M I : I I I : I : 
1081 YTGGATW^VIAAAAAGATTTTAAAGRAWWATGRWTTYTTTTTGGCCCTKSCCYT-CTWCWT 1139 

1076 CCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGG 1132 

I II I I M I : I M I : I : M I I MM: : : I : : : : I : I I I I : 

114 0 CCCCARGGKNCYTTCCYTKS CCGACCCCCGDYT YYCMMCMATTTKTVGGRDGGGGGS 1196 



Search completed: September 8, 2004, 18:14:43 
Job time : 17497 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on: 



September 8, 2004, 02:25:51 ; Search time 29577 Seconds 

(without alignments) 
11782.060 Million cell updates/sec 



Title: US-10-088-4 67-1 

Perfect score: 8040 

Sequence: 1 ccgcggcgctgaggcggcgg aaataaataaacaaaatgtc 8040 



Scoring table: 



Searched: 



IDENTITY_NUC 

Gapop 10.0 , Gapext 1.0 

3470272 seqs, 21671516995 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6940544 



Post-processing : 



Database 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 

GenEmbl : * 



1 
2 
3 
4 
5 
6 
7 
8 
9 
10: 
11: 
12: 
13: 
14: 
15: 
16: 
17: 
18: 
19: 
20: 
21: 
22: 
23: 
24: 
25: 
26: 
27: 



gb_ba : * 

gb_htg : * 

gb_in: * 

gb_om : * 

gb_o v : * 

gb_pat : * 

gb_ph : * 

gb_pl : * 

gb_pr : * 
gb_ro : * 
gb__sts:* 
gb_sy : * 
gb_un : * 
gb_vi : * 
em_ba : * 
em_f un : * 
em_hum: * 
em_in : * 
em_mu : * 
em_om: * 
em_or : * 
em_ov: * 
em_pat : * 
emjph : * 
em_pl : * 
em_ro : * 
em sts:* 



28 


em 


un : * 


29 . 


em 


vi : * 


30 


em 


htg hum: * 


31 


em 


htg inv: * 


32 


em 


htg other : * 


33 


em 


htn mus : * 


34 


em 


htg pin:* 


35 


em 


htg rod : * 


36 


; em 


htg mam: * 


37 


: em 


htg_vrt : * 


38 


: em 


sy : * 


39 


: em 


htgo_hum: * 


40 


: em 


htgo mus:* 


41 


: em 


htgo other: 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
AX522071 

LOCUS AX522071 8056 bp DNA linear PAT 24-OCT-2002 

DEFINITION Sequence 3 from Patent WO02064781. 
ACCESSION AX522071 

VERSION AX522071.1 GI: 24410961 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

REFERENCE 1 

AUTHORS Reiner, P. B., Connop,B.P. and Pollard, M. 

TITLE Regulation of amyloid precursor protein expression by modification 

of abc transporter expression or activity 
JOURNAL Patent: WO 02064781-A 3 22-AUG-2002; 

Active Pass Pharmaceuticals, Inc. (CA) 
FEATURES Location/Qualifiers 
source 1. .8056 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 

ORIGIN 

Query Match 100.0%; Score 8040; DB 6; Length 8056; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 8040; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 
Db 17 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 76 

Q y 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I | I I I I ! I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I 

Db 77 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 136 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

| | I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

D b 137 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 196 



181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I | | | I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I M II I I 

197 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 256 

241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I | I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
257 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 316 

3 01 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I | | | | 1 | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I II I I I 
317 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 37 6 

361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I | | | | | | | | | | | | | | | | I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
377 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 436 

421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 

I M | | I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I 
437 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 96 

481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCT^AAA 54 0 

I I I || I I I I I I I I I I II I I I I I I I I II I I I I I I M II I I I I I ! I I I I I I I I I I I 

497 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 55 6 

541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

| | | | || | I I I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 1 I I I I I M I I I I 

557 CTTGTCGCTGCCCAATAGCACGGCCCi\AGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 616 

601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I 
617 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 67 6 

661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I 

677 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 736 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

| | | | | 1 | | | | M II I I I I II I I I I I I I I I I II I I II II I I I II I I I I I I I I I I I I I I I I I 
737 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 96 

781 GAT CCTCACTGT GCCT GAGAGT CAGAAGGGAGCCCT GCAGGGCTACC GGGATGCT GT CT G 84 0 

| | I I I M I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I 
7 97 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 856 

841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

| | | | | | | | | || | | M I I I I I I I I I II I I I I I I I I I I M I I I I I II II I I I I I I I I I I t I I 
857 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 916 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I II I I I I I I I I I I I I I I I I I I I 

917 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 976 

961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I | | | | || | | | | | | I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I 
977 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1036 

1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 



1037 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1096 

1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCGAA 114 0 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1097 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1156 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1157 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1216 

1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

I | I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1217 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1276 

1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I I I I M I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 

1277 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1336 

1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

I | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I M I I I I I I I I I I I I I 
1337 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1396 

1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1397 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1456 

1441 C GAC CGCGT CAT C CT CAAG GC CAAC GAGACT TT T GCT T T T GT G GGCAAC GT GACT CACT A 1500 

I I I II II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I II I I I I II 

1457 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1516 

1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

| | | I I I I I I I I I I I I I I I t I I I I I I I II I II I I I i I I I I I I I I I I I I I I > M I 1 

1517 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 157 6 

1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

| | | | | | | | | | I I I I I I I I I I I I I I I I II I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I 
1577 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1636 

1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

| M | I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1637 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1696 

1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

| | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1697 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1756 

1741 C CAGTT CAT GT C CAAGGT GAGCGT GGACAT CTT CAAGGGCTT C CCC GAC GAGGAGAGCAT 18 00 

I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

1757 C CAGT T CAT GT C CAAGGT GAG C GT GGACAT C TT CAAGGGCTT CC C C GAC GAGGAGAGCAT 1816 

1801 T GT CAACT ACAC CCT CAAC CAGGC CT AC CAGGACAAC GT CACT GT T T T T GC CAGT GTGAT 18 60 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1817 T GT CAACT ACAC C CT CAAC CAGGC CT AC CAGGACAAC GT CACT GT T T TT GCCAGT GTGAT 1876 



1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 
I I I I I I II I I I I I I I I I I II I I I II I I I I I II I I I I I I I M I I I M II I I I I I II 



Db 


1877 


Qy 


1921 


Db 


1937 


Qy 


1981 


Db 


1997 


Qy 


2041 


Db 


2057 


Qy 


2101 


Db 


2117 


Qy 


2161 


Db 


2177 


Qy 


2221 


Db 


2237 


Qy 


2281 


Db 


2297 


Qy 


2341 


Db 


2357 


Qy 


2401 


Db 


2417 


Qy 


2461 


Db 


2477 


Qy 


2521 


Db 


2537 


Qy 


2581 


Db 


2597 


Qy 


2641 


Db 


2657 


Qy 


2701 


Db 


2717 



CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1936 

CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

I | I I I I | M I I I I M I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1996 

TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 204 0 

I | | I I | || I I I I I I I I II I I I II I I II I I II I I I I I I I I I I I I I I I I t I I II I I I I I I I I 
TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2056 

CGC CAT CAT C GACACTTTT GT GGGGCAC GAC GT GGT GGAGCCAGGCAGCT AC GT GCAGAT 2100 

II I I I I M I I I I I I I I I I I I I I I I M I II I I I I M I I I I I I I I I I I I I I II I I I I 

C GC CAT CAT C GAC ACT T T T GT G GGGC AC GAC GT GGT GGAG C C AGG C AG C T AC GT GCAGAT 2116 
GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

I | | | | | | | || I I II I I I I I I M I I I I I II I I II I I I I I I It I I I I I I I I I I I I I I I I I I I 

GT T C C C CT AC C C CT GCT AC AC AC GC G AT GACTT C CT GT TT GT CAT T GAG C AC AT GAT GC C 2176 
GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

|| | | | | | I I I I I I I I I I I I I I I II I I I I I I II I I I II I I I I M I I I I I I I I I I I I I I I I I 

GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2236 
GGAGAAGGAG C AC C GGCT CAAGGAG GT GAT GAAGAC CAT G GGC C T GAAC AAC G C GGT GCA 22 80 

I I I I I I I I I I I I I I I I I I I I I I II II I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

G GAG AAGGAGC AC CG G CT CAAG GAGGT GAT GAAGAC CAT GGG C CT GAACAAC GC G GT G CA 22 96 

CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

| | I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I I I I 
CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2356 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 24 00 

I | | | | I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2416 

CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

| | | I I M I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2476 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I | | | I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I II I I I I I I I 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2536 
CAT GT AC GT G G C GAT C C GAG AG GAG G T G G C G CAT G AT AAG AT C AC G G C C T T C G AG AAG T G 2580 

I I I I I II I I II I I I I I I I I I I I I I I II MINIMI 

CAT GT AC GT GGC GAT CC GAGAGGAGGT GGC GC AT GAT AAGAT CAC G GC C T T C GAGAAGT G 2596 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 264 0 

M I I I I II I I M I I I I M I II I I I I M I I I II I II I I I I I I I I I I I I I I M I I I I I I II I 
CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2656 

TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

|| | | | I I I I I I I I II I M I I I I I M I I II I I I II I I I I I II I II I I I I I I I I I M I I I I I 
TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2716 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

I M II I II I M M I II M I II II II M II I II M I I I I I II I I I I I II II M M I M I I I 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2776 
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CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 82 0 

I I I I I I I II I I I I II I I I I I I I I I M I I I I I I I 

CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 836 

CTT CCCACT GCAGAAGTCCTACTGGCT GGGCAGTGGGCGGACAGAAGCCTGGGAGT GGAG 2 88 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I 

CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 896 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2940 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2956 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3016 

GGTTGT CT GCGTGGACAAACTCACCAAGGT CTACAAGGACGACAAGAAGCT GGCCCTGAA 3060 

I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 307 6 

CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 
I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3136 

GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I | | | | | | | | I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3196 

C AC CAT CT AC G GGC AC GACAT C C GC AC GGAGAT G GAT GAGAT C C G CAAGAAC CT G GGC AT 324 0 

| | | | | | | | I I I II I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C AC CAT CT AC GGGC AC GACAT C C G C AC GGAGAT GGAT GAGAT C C G CAAGAAC CT GGGC AT 3256 

GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3316 

CT C AC GGCT C AAGAGCAT GGCT CAG GAGGAGAT C C GCAG AGAGAT G GACAAGAT GATC GA 3360 

| M I I I I I I I I M I I I I I I I M I II I I I I I I I I I I i I I I I M I I I I I I I I I I I I I I I I I I 

C T C AC GGCT CAAGAGC AT GGCT C AGG AGGAGAT C C GCAGAGAGAT GGACAAGAT GAT C GA 3376 

GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 342 0 

I I I I I I I I I I I I 1 I I I I ! I I I II II I I I M I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I 

GGAC C T GGAGC T C T C C AACAAAC GGC ACT CAC T GGT GC AGAC AT T GT C GGGT GGC AT GAA 3436 

GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

| | | | II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I II I I I I I I I I I I I I I 
GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3496 

GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

| I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3556 

CAAGC CAG GC C GCAC CAT CCTTCTGTC CAC C CAC CAC AT G GAT GAGG CT GAC CT G CTT GG 3600 
I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I M I I I 
CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3616 
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GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 

| | | || I I I I I I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I M II I I I II 
GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 



3660 



3676 



3720 



CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 

| | | | | II I I I I I I I I I I M I I I I I I I I I I I I II II I I I I I I I II II I I I I I I I I I I II M 
CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGG^ 3736 

GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 8 0 

I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 96 

CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 
CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3856 

AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

| | I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3 916 

CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 397 6 

GCT GAT GGACAC GAC CCT G GAG GAAGT GTT C CT C AAGGT GT CG GAG GAGGAT C AGT C GCT 4 020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCT GAT G GAC AC GAC C CT GGAGGAAGT GT T C C T CAAGGT GT C GGAGGAGGAT C AGT C G CT 4 036 

GGAGAACAGT GAGG C CGAT GT GAAGG AGT C C AGGAAGGAT GTGCTCCCTG G GG C GGAGGG 4080 

I I I I I I I II I II I I I I I I I I I I I I I I II I I I I M I I I I II I I I I I I I I I I I II I I 

GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4 096 

CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

I | I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I M I I I I I I I I M 
CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4156 

GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I | | | I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I 

GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4216 



CT AC AC C GAC GT CT AT GG C GAC T AC CGCCCCCTCTTT GAT AAC C C AC AGG AC C C AG AC AA 
I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II 
CT AC AC C GAC GT CT AT GGC GACT AC CGCCCCCTCTTT GAT AAC C C ACAGGAC C CAGAC AA 



4260 



4276 



TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 432 0 
I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4336 

GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 
I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I II I I I I I I I I I I I I I I M 
GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4396 

CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4 44 0 

I I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I 

CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4 456 



44 41 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 
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I 1 1 1 1 I I 1 1 I I I 1 1 I I I 1 1 I I I 1 1 I I I I I 1 1 I II 1 1 I 1 1 I I I I I I I I 1 1 I I I II I I I 1 1 I 

4457 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4516 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I I I I I I | I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I I I I II I I I M 
4 517 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4576 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 462 0 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
4577 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4636 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 680 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
4 637 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 69 6 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 74 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 697 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 756 

4 741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 00 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4757 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 816 

4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 8 60 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 817 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 87 6 

4861 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 920 

I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4877 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 936 

4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 498 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 937 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4 99 6 

4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I 
4997 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5056 

5041 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 510 0 

M I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5057 CAT C CT GAC C GACAT CAC C GGC CACAAT GT C T CT GAGT ACCT GCT CT T C AC CT C CGAC C G 5116 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
5117 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 517 6 

5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
5177 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 523 6 

5221 GGT TT T CT ACAAC AAC AAGGGCT AT CAC AGCAT GCC CAC CT AC CT CAACAGC CT CAACAA 528 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
5237 G GT T TT CT AC AACAACAAG GGC TAT C ACAGC AT GCC CAC CT AC C T C AAC AG C CT CAACAA 5296 

5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 
I I I I I I I I I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I 
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5297 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5356 
CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5400 

I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I II I I 

CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5416 
GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I II I I I I I I I I 

GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5476 

CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 552 0 

III I I I I I I I I Ill I I I I I I I I I I I I I I I I I I I I I I I 

CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5536 

CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5596 

GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5 640 

I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I II I M I I II I I I I I I M I I I II I I I I 

GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5656 

GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5716 

CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I || | | | | | | | || I I I M I I II I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5776 

TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 582 0 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5836 

C GAGCAC GACAAGGAC CT GAAGGT T GT CAAC AGT TACCT GAAAAGCT G CT T C CT CAT T T T 588 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

C GAG C AC GACAAGGAC CT GAAG GT T GT CAAC AGT T AC CT GAAAAG CT GCT T C C T CAT T T T 58 96 

C C C CAACT ACAAC C T GGGC C AC GG GCT CAT G G AGAT GG C CT AC AAC GAGT AC AT CAAC GA 5940 
I I I 1 I I I I I I I I I I 1 1 I I I I I I I I I I I I I I 1 I 1 I I I I I I I I I t I I I I I I I I I I I I I I I I I 
C C C CAACT ACAAC CT GGGC C AC GGGC T C AT GGAGAT GGC C T ACAAC GAGT AC AT CAAC GA 5956 

GTACT AC GCCAAGATT GGCCAGTT TGACAAGAT GAAGT CCCCGTT CGAGT GGGACATT GT 6000 

II I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I 

GT AC T AC G C C AAG AT T G G C C AGT T T G AC AAG AT GAAGT CCCCGTTC GAGT G G G AC AT T GT 6016 

CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I II I I I I I I II I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I 

CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6076 

GT GC CAGT AC AACTT C CT GC GGC GGC CAC AG CG CAT GC CT GT GT CT AC CAAG C CT GT GGA 6120 
M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I 
GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6136 

G GAT GAT GT G G AC G T G G C CAGT GAG C G G C AG C GAGT GCTCCGGG GAG AC G C C G AC AAT G A 618 0 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

G GAT GAT GT G GAC GT GGC CAGT GAG C GGC AG C GAGT G CT C C G GG GAGAC GC C GAC AAT GA 6196 



Qy 


6181 


CAT G GT C AAGAT T GAGAAC C T GAC CAAGGT CT AC AAGT C C C GGAAGAT T G G C C GT AT CCT 


6240 




1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 I 1 1 M 1 1 1 1 1 1 II 1 ! 1 1 1 1 1 1 1 1 1 1 1 ! 1 II 1 1 1 1 1 1 




Db 


6197 


CAT G GT C AAGAT T GAGAAC CT GAC CAAGGT C T ACAAGT C C C GGAAGAT T G GC C GT AT C C T 


6256 


Qy 


6241 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 


6300 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6257 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 


6316 


Qy 


6301 


C AAC GGTGCGGG C AAG AC C AG C AC C T T C AAGAT G C T GAC C G G C GAC GAG AG C AC GAC G G G 


6360 




1 1 1 1 II 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6317 


CAAC GGT G C G G G CAAGAC CAG CAC CT T CAAGAT G CT GAC C GG C GAC GAGAGCAC GAC G GG 


6376 


Qy 


6361 


GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 


6420 




1 I I I 1 1 I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6377 


GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 


6436 


Qy 


6421 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 


6480 




I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 




Db 


6437 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 


6496 


Qy 


6481 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 


6540 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 




Db 


64 97 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 


6556 


Qy 


6541 


GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 


6600 




1 I I I 1 II II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 




Db 


6557 


GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 


6616 


Qy 


6601 


CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 


6660 




II I 1 M 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 




Db 


6617 


CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 


6676 


Qy 


6661 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


6720 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6677 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


6736 


Qy 


6721 


CCT CGAC CT CAT CAAGAC AGGGC GT T C AGT GGT GCT GAC AT CAC AC AGC AT G GAGGAGT G 


6780 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


6737 


CCT CGACCT CAT CAAGACAGGGCGTT CAGT GGTGCT GACATCACACAGCAT GGAGGAGT G 


6796 


Qy 


6781 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6840 






I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6797 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6856 


Qy 


6841 


CAT CCAGCACCTGAAGAAC CGGT TT GGAGAT GGCTACAT GAT CACGGT GCGGACCAAGAG 


6900 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6857 


CAT CCAGCAC CTGAAGAACCGGTTTGGAGAT GGCTACAT GAT CAC GGT GCGGACCAAGAG 


6916 


Ov 


6901 


CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


6960 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


6917 


CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


6976 


Qy 


6961 


C AAGGAGC GGC AC C ACACAAAG GT GC AGT AC C AG CT CAAGT C GGAGCAC AT CTCGCTGGC 


7020 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


6977 


CAAGGAGCGGCACCACACAAAGGTGCAGT AC CAGCTC AAGT CGGAGCACAT CTCGCTGGC 


7036 



Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



7021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7 080 

I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I 

7037 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7096 

7081 CAGC C AGAC C ACAC T G GACAAT GT GT T C GT GAACT T T GC CAAGAAGCAGAGT GAC AAC C T 714 0 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I 

7097 CAGC C AGAC C AC ACT G GACAAT GT GT T C GT GAACT T T GC CAAGAAGCAGAGT GAC AAC CT 7156 

7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I II M I I I I 

7157 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7216 

72 01 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 72 60 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I 

7217 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7276 

7261 GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7277 GGAC C T GGAC AC G GAGGAC GAGG GC C T CAT C AGCT T C GAGGAGGAG C GGGC C C AG CT GT C 7336 

7321 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

7337 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7396 

7381 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 74 40 

I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

7397 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7456 

7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 

7457 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7516 

7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7517 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 757 6 

7561 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7 620 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7577 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7636 

7621 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7680 

I I I I I I I I I I I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7637 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 769 6 

7681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I I I 

7697 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7756 

7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7800 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

7757 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7816 

7801 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7 8 60 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7817 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7 87 6 

78 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7920 



Db 



7877 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7936 



Qy 7921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 798 0 

I I I I I I I I I II I II I I I I I I I I I I I II I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I 

Db 7937 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7996 

Qy 7981 TGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATAAACAAAATGTC 804 0 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7997 TGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATAAACAAAATGTC 8 056 
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AF178941 8056 bp mRNA linear PRI 04-MAY-2001 

Homo sapiens ATP-binding cassette sub-family A member 2 (ABCA2) 
mRNA, complete cds . 
AF178941 

AF178941.1 GI:9957466 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 (bases 1 to 8056) 

Vulevic,B., Chen,Z., Boyd, J. T., Davis, W. Jr., Walsh, E.S., 
Belinsky,M.G. and Tew, K. D. 

Cloning and characterization of human adenosine 

5 f -triphosphate-binding cassette, sub-family A, transporter 2 

(ABCA2) 

Cancer Res. 61 (8), 3339-3347 (2001) 

21205831 

11309290 

2 (bases 1 to 8056) 

Vulevic,B., Chen,Z., Walsh, E.S. and Tew,K.D. 
Direct Submission 

Submitted ( 19-AUG-1999 ) Pharmacology, Fox Chase Cancer Center, 7701 
Burholme avenue, Philadelphia, PA 19111, USA 

Location/Qualifiers 

1. .8056 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/ ch r omo s ome= " 9 " 

/map="9q34" 

/ tissue_type="brain" 

1. .8056 

/gene="ABCA2" 

51. .7361 

/gene="ABCA2 " 

/note="ATP binding cassette transporter 2; transmembrane 
protein highly expressed in brain; belongs to ABCl family" 
/codon_start=l 

/product="ATP-binding cassette sub-family A member 2" 
/protein_id="AAG09372 . 1" 
/db_xref="GI: 9957467" 

/ translation="MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQ 



KKPTISVKEVPFYTAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDR 
WEEGNLFDPARPSLGSELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQ 
ELWRFLTQNLSLPNSTAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLG 
GNPLFRMEELLLAPALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAAR 
ARRFSGLSAELRNQLDVAKVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVL 
Q DVDVL S ALAL L L P Q GACT G RT P G P PAS GAGGAAN GT GAGAVMG PNAT AEE GAP S AAA 
LATPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLL 
VHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTHYAQVWLNISAEIRSFLEQGR 
LQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAAC 
GWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKDGSLPPHVHY 
KI RQNS S FTEKTNEI RRAYWRPGPNTGGRFYFLYGFVWIQDMMERAI I DTFVGHDWE 
PGSWQMFPYPCYTRDDFLFVIEHI^PLCMVISWVYSVAMTIQHIVTVEKEHRLKEVMK 
TMGLNNAVHWVAWFI TGFVQLS I SVT ALTAI LKYGQVLMHSHWI I WL FLAVYAVAT I 
MFCFLVSVLYSK7U<LASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMST 
TAFGLGSKYFALYEVAGVGIQWHTFSQSPVEGDDFNLLLAVTMLMVDAVVYGILTWYI 
EAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACAMESR 
RFEETRGMEEEPTHLPLWCVDKLTKVYKDDKKL7VLNKLSLNLYENQWSFLGHNGAG 
KTTTMS I LTGLFPPTS GSAT I YGHDI RTEMDEI RKNLGMCPQHNVLFDRLTVEEHLWF 
YSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAII 
LDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCG 
SPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHV 
ASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDAiHLSSFGLMDTTLEEVFL 
KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASS 
VGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLK 
VRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQ 
' YHNYTQPRGNFIPYANEERREYRLRLS PDAS PQQLVSTFRLPSGVGATCVLKS PANGS 
LGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQ 
AWN VS LP PTAG P EMWT SAP S L P RLVRE P VRCT C S AQ GT GFS C P S S VGGH P PQMRWT G 
D I LT D I T GHN VS EYLLFTSDRFRLHRY G AI T FGNVL K S I PAS FGT RAP PMVRK I AVRR 
AAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSL 
DYLLQGTDWIAI FI IVAMSFVPAS FVVFLVAEKSTKAKHLQFVSGCNPI I YWLANYV 
WDMLN YLVPATCCVI I L FVFDLPAYT S PTN FPAVLS LFLL YGWS I T P IMYPAS FWFEV 
PSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKWNSYLKSCFLIFPNYNLGHGL 
MEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGWGFLLTIMCQYNFLR 
RPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRL 
CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGY 
CPQCDALFDELTAREHLQLYTRLRGISWKDEARWKWALEKLELTKYADKPAGTYSGG 
NKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSWLTSHSMEE 
CEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDWRFFNRNFPE 
AMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKK 
QSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE 
EERAQLSFNTDTLC" 

ORIGIN 

Query Match 100.0%; Score 8040; DB 9; Length 8056; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 804 0; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 17 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 76 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 77 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 136 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 137 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGGTGGGGCTGCGACAGAAG7\AGCCCACCAT 196 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 197 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 256 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
Db 257 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 316 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 317 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 376 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 377 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 436 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I 

Db 437 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 96 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 497 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 556 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I I I I II I t I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 557 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 616 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 617 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 676 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 677 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 73 6 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 737 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 96 

Qy 781 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 7 97 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 856 

Qy 841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 857 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 916 

Qy 901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 
Db 917 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 976 

Qy 961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 



Db 977 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1036 

Qy 1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1037 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1096 

Qy 1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1097 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1156 

Qy 1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1157 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1216 

Qy 1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1217 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1276 

Qy 1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1277 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1336 

Qy 1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1337 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1396 

Qy 1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1397 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1456 

Qy 1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1457 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1516 

Qy 1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1517 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1576 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1577 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1636 

Qy 1621 ACT GAAC CTGT CACT GGAT GAGCT GC CGCCGGC CCT GAGACAGGACAACTTCT CGCT GCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1637 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1696 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1697 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1756 

Qy 1741 C C AG T T CAT G T C C AAG GT GAG C GT G G AC AT C T T C AAG GGCTTCCCC G AC GAG GAG AG CAT 1800 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II I I I I 
Db 1757 C C AG T T CAT GT C C AAG GT GAG C GT G G AC AT C T T C AAG GGCTTCCCC GAC GAG GAG AG CAT 1816 

Qy 18 01 T GT C AACT ACAC CCT CAAC C AG GC CT AC CAG GAC AAC GT CACT GT T T T T GC CAGT GT GAT 1860 

I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 1 I I I II II I I I I I I I I I I I I I I I I I I I I I 
Db 1817 T GT CAAC T ACAC CCT CAAC CAG GCC T AC CAG GAC AAC G T C AC TGTTTTTGC CAG T GT GAT 1876 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 
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Qy 
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Qy 

Db 

Qy 
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1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 

I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I M I I I I I I I II I I I I I I II I II II 
187 7 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1936 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 198 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I 

1937 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1996 

1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 04 0 

I I M I I I I I I I I I i I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 
1997 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 056 

2041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 210 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2057 C GC CAT CAT C GACAC T T T T GT GGGGC AC GAC GT G GT GGAGC CAG GC AG CT AC GT G CAGAT 2116 

2101 GT T C C C C T AC C C C T G C T AC AC AC G C GAT GAC TTCCTGTTTGT CAT T GAG C AC AT GAT G C C 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2117 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 217 6 

2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
217 7 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2236 

2221 GGAGAAGGAGCACC GGCT C AAG GAGGT G ATGAAGAC CAT GG GC CT GAACAAC GCG GT G C A 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2237 GGAGAAGGAG CACC GGCT C AAG GAGGT GAT GAAGAC CAT GG G C CT GAACAAC GC G GT G C A 22 96 

2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2297 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2356 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2357 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2416 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I 
2417 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2476 

2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
2477 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2536 

2 521 CAT GT AC GT GGC GAT C C GAGAGGAGGT G G CGCAT GAT AAGAT CAC GGC CT T C GAGAAGT G 2580 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I 
2537 CAT GT AC GT GGC GAT C C GAGAG GAGGT G G CG CAT GAT AAGAT CAC GGC CT T C GAGAAGT G 2596 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 264 0 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 11 1 I I I I I I I I 
2597 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 656 

2 641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I II II I I I II I I I I I I I I I I I I I I M I 
2657 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2716 
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Db 
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Qy 
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Qy 

Db 

Qy 
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Qy 
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Qy 
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2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2 7 60 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I 
2717 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2776 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 282 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 
2777 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2836 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 288 0 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2837 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 8 96 

2 8 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2897 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2956 

2941 GGAGAGC C G GC GCT T T GAGGAGAC CC GT GGC AT G GAG G AGGAG C CCACC CAC CT GC CT CT 300 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2957 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3 016 

3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
3017 GGTT GT C T GC GT GGACAAAC T CAC CAAG GT CT ACAAGGAC GACAAGAAG CTGGCCCT GAA 307 6 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3077 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3136 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3137 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3196 

3181 CAC CAT CTACGGGCACGACAT CCGCACGGAGATGGAT GAGAT CC GCAAGAACCT GGGCAT 3240 

I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
3197 CAC CAT C T ACGGG CAC GAC AT C CG C AC GGAGAT GGAT GAGAT C C G CAAGAAC C T GGG C AT 3256 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3316 



3257 



3360 



3301 CT CACG G CT CAAGAGC AT GGC T C AG GAG GAGAT C C GC AGAGAGAT GGACAAGAT GAT C GA 
II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
3317 CT CACGGCT CAAGAGCAT GGCT CAGGAGGAGAT CC GC AGAGAGAT GGACAAGAT GAT C GA 337 6 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 342 0 

I I I I I II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
3377 G GAC CT G GAG C T CT C CAACAAAC GGC ACT CACT G GT G CAGAC AT TGTCGGGTGG CAT GAA 3436 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 8 0 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
3437 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 96 

3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
3497 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3556 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 
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Qy 


4081 


Db 


4097 
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Qy 
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4217 


Qy 
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4277 


Qy 
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4337 


Qy 


4381 



I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I M I I I I I I I I I I I I 

CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3616 

GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I 1 | I I I I | I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II I I I M I I I I I I I I I I I 
GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3676 

CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 372 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3736 

GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 80 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 96 

CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 38 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I II 
CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3856 

AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3916 

CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 397 6 

GCT GAT G GAC ACGAC C CT GGAG GAAGT GT T C CT C AAG GT GT C G GAGGAG GAT C AGT C GCT 4 020 

I I I I I I I I I I I I I I I II I I I! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCT GAT GGAC ACGAC C CT GGAGGAAGT GT T C C T CAAGGT GT C G GAG GAG GAT C AGT C GCT 4 036 

GGAGAACAGT GAGGCC GAT GT GAAGGAGT CCAGGAAGGAT GT GCT CCCTGGGGCGGAGGG 4 08 0 
I M I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGT GCT CCCTGGGGCGGAGGG 4096 

CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4156 

GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 00 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4216 

C T AC AC C GAC G T C T AT G G C GAC T AC CGCCCCCTCTTT G AT AAC C C AC AG GAC C C AG AC AA 4260 

I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT AC AC C GAC GT CT AT GG C GACT AC C GC C C C CT CT TT GAT AAC C C AC AGGAC C C AGACAA 4276 

TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

II I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II I I I I I II II I I I I I I I I I I I I I I I 
TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4336 

GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 
GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4396 

CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4440 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I 



Db 4 397 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4456 

Qy 44 41 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I I I I I I I II I I II I 1 I II I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I 
Db 4457 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4516 

Qy 4 501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4517 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4576 

Qy 4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 462 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 4577 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4636 

Qy 4 621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 468 0 

I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 637 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 69 6 

Qy 4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4697 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4756 

Qy 4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 48 00 

I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4757 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4816 

Qy 4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 48 60 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I II 

Db 4817 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4876 

Qy 4861 GCAGGCCTGGAACGTCTCCCTGCCGGCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 
Db 4 877 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4936 

Qy 4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 498 0 

I I M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 4937 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4996 

Qy 4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5040 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

Db 4 997 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5056 

Qy 5041 CAT C C T GACC GAC AT C ACC G GC C ACAAT GT C T CT GAGT AC CT GCT CT T C AC CT C C GAC C G 5100 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M 

Db 5057 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5116 

Qy 5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 5117 CTT C C GACT GC AC C GGT AT G GG G C CAT CAC C TT T GGAAAC GT C CT GAAGT C CAT C C CAGC 517 6 

Qy 5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I II I I I I I I I II I I 

Db 5177 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 52 36 

Qy 5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 528 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5237 G GT T T T CT ACAACAACAAG GG C TAT C ACAGC AT GC C CAC CT AC CT CAAC AG C CT C AACAA 5296 



Qy 


5281 


Db 


5297 


Qy 


5341 


Db 


5357 


Qy 


5401 


Db 


5417 


Qy 


5461 


Db 


5477 


Qy 


5521 


Db 


5537 


Qy 


5581 


Db 


5597 


Qy 


5641 


Db 


5657 


Qy 


5701 


Db 


5717 


Qy 


5761 


Db 


5777 


Qy 


5821 


Db 


5837 


Qy 


5881 


Db 


5897 


Qy 


5941 


Db 


5957 




OUUl 


Db 


6017 


Qy 


6061 


Db 


6077 



CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I II I I I I I 
CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5356 

CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 54 0 0 

I I I I I M I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I 

CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5416 

GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

M I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I 
GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5476 

CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I N I I I I I I I I I I I I I I I 
CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5536 

CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5596 

GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 564 0 

| | | | | | | | | M I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5656 

GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I M I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I 
GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5716 

CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I I I I I I I I I I I II I I 1 I I I I I M I I I I I I I I I I I I I I 1 I I 1 I I I I I I I I I I I I I I I I 

CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 577 6 

TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 582 0 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 583 6 

CGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTT 5880 

I I M II I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

C GAG C AC GACAAGGAC CT GAAGGT T GT C AAC AGT T AC C T GAAAAGCT GCT T C C T CAT T T T 5896 

CCCCAACTACAACCT GGGC CACGGGCTCATGGAGAT GGCCTACAACGAGTACAT CAAC GA 594 0 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

CCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGA 5956 
GT AC T AC GC C AAG AT T G G C C AGT T T G AC AAGAT GAAGT CCCCGTTC G AGT G G G AC AT T GT 6000 

I | | | I I I I II I I I I I I I I I I I I I I I I I I I I M II I I I II I I I I I I I I I I I I I I I I I I I I I 

GT ACT AC G C CAAGAT T GGC C AGT T T GACAAGAT GAAGT C C C C GT T C GAGT G GGAC AT T GT 6016 

CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 
| M | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 607 6 

GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

| | | | | I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6136 



Qy 


6121 


GGAT GAT GT GGAC GT G GC C AGT GAG C GGC AGC GAGT G CT C C G G GG AGAC GC C GAC AAT GA 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 
G GAT GAT GT G GAC GT G G C C AGT GAG C G GC AG C GAGT G C T C C G G GG AG AC G C C GAC AAT G A 


ci on 
DiOU 


Db 


6137 


d ± y o 


Qy 


6181 


CAT GGT CAAGAT T GAG AAC CT GAC C AAG GT CT ACAAGT C C C GGAAG AT T G G C C GT AT C C T 
1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 
CAT GGT CAAGAT T GAGAAC C T GAC CAAGGT C T AC AAGT C C C G GAAGAT T G G C C GT AT C C T 


DZ u 


Db 


6197 


D D 


Qy 


6241 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 

1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 


djU U 


Db 


6257 


DO 1 D 


Qy 


6301 


C AAC GGTGCGGG C AAGAC C AG C AC CT T CAAGAT G C T GAC C G G C GAC GAG AG C AC GAC G G G 

III 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 

CAAC G GT G C GGGC AAGAC C AG C AC CT T CAAGAT G CT GAC C GGC GAC GAGAGC AC GAC GGG 


a 9 c n 


Db 


6317 


C 1 "7 C 

Do / D 


Qy 


6361 


GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 

II I I I I I I I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II ! 1 I 1 1 1 

GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 


d4z U 


Db 


6377 


643 6 


Qy 


6421 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 

| | | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 


64 8 0 


Db 


6437 


64 96 


Qy 


6481 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 

M | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 


do4 0 


Db 


6497 


DODO 


Qy 


6541 


GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 
| | | | | I I M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GGCT CT GGAGAAGCT GGAGCT GAC CAAGT ACGCAGACAAGCCGGCT GGCACCT ACAGC GG 


c a. c\ C\ 

ddOO 


Db 


6557 


ddId 


Qy 


6601 


CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 

I | || I I I I 1 I I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 


DDDU 


Db 


6617 


C C H C 

O D / O 


Qy 


6661 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 

| | | | | | I I I I I 1 1 1 1 1 1 1 1 II 1 1 II 1 II 1 1 1 1 II 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


/-Ton 
b/zU 


Db 


6677 


d/3d 


Qy 


6721 


C CT CGACCT CAT C AAGACAGGGC GT T CAGT G GT GCT GAC AT C AC AC AGCAT GGAG GAGT G 
| | | | I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 
C CT C G AC CT CAT CAAGACAGGG C GTT C AGT GGT G CT GACAT CAC ACAGC AT GGAGGAGT G 


b/oU 


Db 


6737 


o / y D 


Qy 


6781 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 

I I I I I I 1 I I II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 
CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6840 


Db 


6797 


boDD 


Qy 

Db 


6841 
6857 


CAT C C AG C AC CT GAAGAAC C GGT T T G GAGAT GGC T AC AT GAT CAC GGT GC GGACCAAGAG 
I I I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 
CAT CCAGC AC CTGAAGAACCGGTTT GGAGAT GGCTACAT GAT CAC GGT GCGGACCAAGAG 


by uu 
by lb 


Qy 


6901 


CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 

| | | I I I I I I I I 1 I 1 I I I I I I I 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 
CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


6960 


Db 


6917 


6976 


Qy 


6961 


CAAGGAGC GGCAC CACACAAAGGT GCAGTAC CAGCT CAAGT CGGAGCAC AT CT CGCTGGC 


7020 



I I I I I I I I I I II I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6977 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7036 

Qy 7021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7080 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I M I I I I I I I I I I I I I 

Db 7 037 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7 096 

Qy 7081 CAGCCAGACCACACT GGACAAT GT GT T C GT GAACTTT GCCAAGAAGCAGAGT GACAAC CT 7140 

I I I I I I I I I I II I I II I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 
Db 7097 CAGCCAGACCACACT GGACAAT GT GT T C GT GAACTTT GCCAAGAAGCAGAGT GACAAC CT 7156 

Qy 7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7157 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7216 

Qy 7201 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 7217 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 727 6 

Qy 7261 G GAC CT GGAC AC GGAG GAC GAG GGC CT C AT C AGCTT C GAGGAGGAG C GGGC C CAG C T GT C 7320 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7277 GGAC CT GGAC AC GGAGGAC GAG G GC C T CAT C AGCTT C GAGGAGGAG C GGGC C CAG C T GT C 7336 

Qy 7321 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 738 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7337 CT T CAACAC GGACAC GCT CT G C T GAC CAC C C AGAGC T GG GCCAGGGAGGAC AC GCT C C AC 7396 

Qy 7381 T GAC CAC C CAGAGCT GGGC CAG GGACT CAACAAT GG G GACAGAAGT C CC CCAGT GC CT GC 744 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 7397 T GAC CAC C CAGAGCT GGG C CAG GGACT CAACAAT GG G GACAGAAGT C C C C C AGT G C C T G C 7456 

Qy 7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 7457 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7516 

Qy 7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 7517 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 757 6 

Qy 7561 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 762 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I M I I I I I I I I M I I I I I I I I 

Db 7 577 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7 636 

Qy 7621 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7637 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7696 

Qy 7 681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I 
Db 7697 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7756 

Qy 7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7 800 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M II 
Db 7757 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7816 

Qy 7 801 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 78 60 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 7817 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7876 



Qy 

Db 

Qy 

Db 

Qy 

Db 



7 8 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7 920 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

7 877 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7 936 

7 921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7980 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

7 937 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7 996 

7 981 T GG GAGC C GG GC CT GT AC AT AGC G C AC AGAT GT T T GT T T T AAAT AAAT AAAC AAAAT GT C 8 040 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I IN 

7997 TGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATAAACAAAATGTC 8056 
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PN WO 0208424-A/l 

PD 31-JAN-2002 
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PR 26-JUL-2000 JP OOP 225462 
PI NOBUYA INAGAKI 
PC 

C12N15/12,C07K14/47,C12N1/15,C12N1/19,C12N1/21, C12N5/00, G01N33/ PC 
68, 

PC G01N33/15,G01N33/50 

CC Human and rat ABCA2 gene 

FH Key Location/Qualifiers 

FT source 1- .8269 

FT /organism= 1 Homo sapiens (human) ' . 

Location/Qualifiers 
1. .8269 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 
/db xref="taxon:9606" 



Query Match 100.0%; Score 8036.4; DB 6; 

Best Local Similarity 100.0%; Pred. No. 0; 
Matches 8037; Conservative 0; Mismatches 1; 



Length 8269; 
Indels 0; Gaps 



0; 



Qy 



3 GCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGC 62 



218 GCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGC 277 
63 TGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCT 122 

MINIM II M I II I I M I M M I I I M M II M I M M I M I II M I 

27 8 TGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCT 337 
123 TCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCT 182 

M M I M I I M I I II I M II I I I M I I I I I I I I M II I M I I I I II M I M I I I I 

338 TCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCT 397 
183 CCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTG 242 

I || M I I II M I M I I I M I I I M I I I II I I I II I II I I I I M I II I I II I II II I I I I 

398 CCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTG 457 
243 T CAT GC AAT CGCTGTGCC C GGAC G G C C AGC GAGAC GAGT TCGGCTTCCT GC AGT AC GC C A 3 02 

I I II M I M I II II II I M II I I II I I M I I I I I I I I I II I M I I II I I M M I 

458 TCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCA 517 

303 AC T C C AC GGT C AC G C AG CT GC T T G AGC GC CT GGAC C G C GT GGT GGAG GAAG G C AAC CT GT 362 

| | || M II I II I I II II I M II II M I I I II I M I I II I I I I I I I I II II I I II I II I I I 
518 ACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGT 577 

363 TTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGG 422 

I I M II I I I I I I I I I II I I I I I II I I M I M I I I I I I I II I M I M M I I I I I II I I I I I 
578 TTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGG 637 

423 CCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCT 482 

| | | I M | I I I II I I II I II I I I M I M M M I M I I II I II I I M I I I I I I I I I I I I I I I 
638 CCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCT 697 

483 TCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACT 542 

I I I I I I II I I II I I I I I M I II I I I M I M I I I M II I II I I I I 

698 TCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACT 757 

543 TGTCGCTGCCCT^ATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGG 602 

I M | I II II II I I I I II I I I I I II I M I II I I I M II II M I II M I I I II I II I II M I 

758 TGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGG 817 

603 TCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGG 662 

| II I I II I II I M M M I I I I I I I I M M I I II I I I I II II I M I I I I M I I I II 

818 TCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGG 877 

663 GTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGC 722 

|| | | | | || || I I I I II I II I I M M I I II I M I M I I I I I I II I I I 

878 GTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGC 937 

723 TGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGA 782 

|| | | | | || II I II I II II I I I I I I I II II II I I I I II I I M I I I I I I I I I I I I II I I M I 
938 TGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGA 997 

783 TCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCA 842 

| || II II II M I I I I I M M M I I II I I I M I I I I II M I I II I I I II I II I II II I I I I 
998 TCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCA 1057 

843 GTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACC 902 
I || | II I I II I II I I I II I I I I II I I II I I I I I I I M M I M I I I II I I I I II II M I I I 



Db 


1058 


GTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACC 


±11/ 


Qy 


903 


AGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGCjA 








1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1118 


AGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGAC1 


1 1 H 
11// 


Qy 


963 


CCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATG 


1022 


Db 


1178 


1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATG 


1 TOT 

1Z o / 


Qy 


1023 


CCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGG 


1082 






1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 I 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 11 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 




Db 


1238 


CCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGG 


i^y / 


Qy 


1083 


GTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATG 


1142 




1 I I M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 It 1 1 




Db 


1298 


GTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATG 


lio / 


Qy 


1143 


GCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTG 


1202 




1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 II 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1358 


GCACTGGGGCAGGGGCAGTCATGGGCCCC7\ACGCCACCGCTGAGGAGGGCGCACCCTCTG 


1417 


Qy 


1203 


CTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCT 


1262 




I I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


1418 


CTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCT 


14 / / 


Qy 


1263 


GGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGC 


1322 




1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


1478 


GGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGC 


1537 


Qy 


1323 


GGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCC 


1382 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


1538 


GGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCC 




Qy 


1383 


TCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCG 


1442 




I | | I I I I I I I I 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


1598 


T C GT GC AC CT CAT GAC CAGCAAC C C CAAAAT C CT GT AC GC GCC T G C GG GCT CT GAGGT C G 


165 / 


Qy 


1443 


ACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATG 


1502 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1658 


AC C G C GT CAT C CT C AAG GC CAAC GAGACT T T T G CT T TT GT GGGCAAC GT GAC T C ACT AT G 


1 HI T 
1 / 1 / 


Qy 


1503 


CCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGC 


1562 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


1718 


CCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGC 


1 1 1 1 
Iff/ 


Qy 


1563 


AGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCAC 


1622 




1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 




Db 


1778 


AGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCAC 


1 Q Q 1 

loo / 


Qy 


1623 


TGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCA 


1682 




1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 




Db 


1838 


TGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCA 


1897 


Qy 


1683 


GTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCC 


1742 




1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 II 




Db 


1898 


GTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCC 


1957 



Qy 1743 AGT T C AT GT C C AAG GT GAGC GT G GAC AT CT T CAAGGGC T T C C C C GAC GAG GAGAGCAT T G 1802 

I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I 

Db 1958 AGT T C AT GT C CAAG GT GAGC GT G GAC AT CT T CAAGGG CTT C CC C GAC GAG GAGAG CAT T G 2017 

Qy 18 03 T C AAC T AC AC C CT C AAC C AGG C C T AC C AG GAC AAC GT C AC TGTTTTTGC C AGT GT GAT C T 18 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I 

Db 2018 T CAAC T AC AC C CT C AAC C AGG C C T AC C AGGACAAC GT CAC T GT T T T T GCC AGT GT GAT C T 2077 

Qy 18 63 TCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACT 1922 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2078 TCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACT 2137 

Qy 1923 CCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATA 1982 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2138 CCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATA 2197 

Qy 1983 CTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCG 2042 

I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2198 CTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCG 2257 

Qy 2043 CCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGT 2102 

I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2258 CCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGT 2317 

Qy 2103 TCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGC 2162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 

Db 2318 TCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGC 2377 

Qy 2163 T GT GC AT GGT GAT CT C CT GGGT CT ACT CC GT G GC CAT GAC CAT CC AGC ACAT C GT G GC G G 2222 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 237 8 TGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGG 2437 

Qy 2223 AGAAG GAG CAC C GGCT CAAGGAGGT GATGAAGAC CAT GGG C CT GAACAAC GC GGT G CACT 22 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 243 8 AGAAG GAGC AC CGG CT CAAGGAG GT GAT GAAGAC CAT G GG C CT GAACAAC GC G GT GC ACT 24 97 

Qy 2283 GGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCG 2342 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I 

Db 2498 GGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCG 2557 

Qy 2343 CCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCC 2402 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2558 CCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCC 2617 

Qy 24 03 TGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCA 24 62 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 2618 TGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCA 2677 

Qy 2463 AGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACA 2522 

I I I I I I I I II I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2678 AGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACA 2737 

Qy 2523 T GT AC GT GGC GAT C C GAGAGG AGGT G G CG CAT GAT AAGAT CAC GGC C T T C GAGAAGT G C A 2582 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 

Db 2738 T GT AC GT GG C GAT C C GAGAGGAGGT GG C GCAT GAT AAGAT C AC GG C CT T C GAGAAGT G C A 2797 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



2583 TCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATG 2 642 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

279 8 TCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATG 2857 

2643 AGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACG 2702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I M I I I I I 

2858 AGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACG 2 917 

2703 ACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCC 27 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2918 ACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCC 2 977 

2763 TCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACT 2 822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I 

2978 TCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACT 3037 

2 823 TCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCT 2 8 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3038 TCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCT 3097 

2883 GGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGG 2942 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I 

309 8 GGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGG 3157 

2943 AGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGG 3002 

II I | I II I I I I I I I I I I I I I I I I I I I 1 I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 
3158 AGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGG 3217 

3003 T T GT CT G C GT GGACAAACT CAC CAAG GT CT ACAAGGAC GACAAGAAG CT GG C C CT GAAC A 3062 

I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3218 T T GT CT GC GT GGACAAACT CAC CAAG GT C T ACAAGGAC GACAAGAAG CTGGCCCT GAAC A 3277 

3063 AGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGG 3122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I II I I I I I I 

327 8 AGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGG 3337 

3123 GCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCA 3182 

II I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I 

333 8 GCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCA 3397 

3183 CCATCTACGGGCAC GACAT CC GCACGGAGAT GGATGAGAT CCGCAAGAACCT GGGCAT GT 3242 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

3398 CCAT CT AC G G G CAC GACAT C C G CAC GGAGAT GGAT GAGAT C C GCAAGAAC C T GGGCAT GT 3457 

324 3 GCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACT 3302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 

3458 GCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACT 3517 

3303 CACGGCT CAAGAGCATGGCTCAGGAGGAGAT CC GCAGAGAGAT GGACAAGAT GAT CGAGG 3362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3518 CAC GG CT C AAGAGC AT G GCT C AG GAGGAGAT C C G CAGAG AG AT GGACAAGAT GAT C GAGG 3577 

3363 ACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGC 3422 

I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I II I I II I I I I I I II I I I I I I II I I I 

3578 ACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGC 3637 

3423 GCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGC 34 82 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I II I I I I I I I 
3638 GCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGC 3697 



Qy 34 83 CCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACA 3542 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 3698 CCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACA 3757 

Qy 3543 AGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGG 3602 

II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 3758 AGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGG 3817 

Qy 3603 ACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCA 3662 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3818 ACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCA 3877 

Qy 3663 AGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGG 3722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3878 AGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGG 3937 

Qy 3723 GCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCT 3782 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3938 GCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCT 3997 

Qy 3783 CCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAG 3842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 39 98 CCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAG 4 057 

Qy 38 43 ACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCG 3902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4058 ACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCG 4117 

Qy 3903 AGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGC 3962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 4118 AGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGC 4177 

Qy 39 63 T GAT G GAC AC GAC C CT G GAGGAAGT GTT CCT C AAG GT GT C GGAGGAGGAT CAGT C GCT GG 4022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I 
Db 4178 T GAT G GAC AC GAC C CT G GAGGAAGT GTT CCT CAAGGT GT C GGAGGAGGAT CAGT C G CT GG 4237 

Qy 4023 AG AAC AGT GAG G C C GAT GT G AAG G AGT C C AG G AAG GAT GTGCTCCCTGGGGCG GAG G G C C 4082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I 
Db 4238 AGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCC 4297 

Qy 4083 CGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGC 4142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4298 CGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGC 4357 

Qy 4143 AGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCT 4202 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4358 AGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCT 4417 

Qy 42 03 AC AC C GAC GT C TAT G G C GAC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AG AC AAT G 42 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4418 ACAC C GACGT C TAT GGC GAC T AC CGCCCCCTCTTT GAT AAC C C AC AGG AC C C AGACAAT G 44 77 

Qy 42 63 TCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGC 4322 

I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
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Db 
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Qy 
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Qy 

Db 



4478 TCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGC 4 537 

4323 TGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACT 4382 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
4538 TGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACT 4 597 

4383 GCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCT 4442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
4598 GCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCT 4657 

444 3 GCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCC 4 502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
465 8 GCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCC 4717 

4503 TGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCA 4562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
4718 TGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCA 4777 

4563 ACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCG 4 622 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I ! I I I 

4778 ACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCG 4 837 
4 623 TGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCA 4 682 

II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 838 TGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCA 4 897 

4 68 3 ACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTC 4742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 8 98 ACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTC 4 957 

4743 GGTTCTT CGACAGCAT GTGT CT GGAGT CCTTCACACAGGGGCTGCCACT GT CCAATTTCG 4 802 

I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4958 GGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCG 5017 

4803 TGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGC 4 862 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5018 TGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGC 5077 

4 863 AGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCT 4 922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
507 8 AGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCT 5137 

4 923 CCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCT 4 982 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
5138 CCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCT 5197 

4 983 TCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACA 5042 

I I I I I I I I I I I II I I I I I I I I I M I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5198 TCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACA 5257 

5043 TCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCT 5102 

I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
5258 TCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCT 



5103 TCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCT 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5318 TCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCT 



5317 



5162 



5377 



5163 CATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGG 5222 

I I I I I I I I I I I II I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5378 CATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGG 5437 

5223 TTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACG 5282 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I 
5438 T T T T C T AC AAC AAC AAG G G CT AT C AC AG CAT GC C C AC C T AC CT C AAC AGC C T C AAC AAC G 5497 

5283 CCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCG 5342 

I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
5498 CCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCG 5557 

5343 TCACCT^ACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGG 54 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5558 TCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGG 5617 

5403 GCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCT 5462 

I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

5618 GCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCT 567 7 

54 63 TCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCG 5522 

I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5678 TCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCG 5737 

5523 GCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTC7UVCTACCTGG 5582 

I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5738 GCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGG 5797 
5583 TCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGC 5642 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I 

5798 TCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGC 5857 

5643 CCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCA 5702 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5858 CCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCA 5917 

5703 TCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTG 57 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
5918 TCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTG 5977 

5763 TCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCG 5822 

1 I I I I II I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
597 8 TCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCG 6037 

5823 AG CAC GACAAGGAC CT GAAGGT T GT CAAC AGT TAC CT GAAAAG CT GCT T C CT C AT T T T C C 5882 

I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

6038 AG CAC GAC AAG GACC T GAAGGT T GT CAAC AGT TAC CT GAAAAGCT GCT T C C T CAT T T T C C 6097 

5883 CCAACTACAACCT GGGC CAC GGGCTCAT GGAGATGGC CT ACAACGAGT AC AT CAACGAGT 5942 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 
6098 C CAACTAC AAC CT GG GC CAC GG GC T CAT G GAGAT GGC CT ACAAC GAGT AC AT CAAC GAGT 6157 

5943 AC T ACGC C AAGAT T GGC CAGT T T GAC AAGAT GAAGT C C C C GT T C GAGT GGGAC AT T GT C A 6002 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6158 AC TAC GC CAAGAT T GGC CAGT T T GACAAG AT GAAGT C C C C GT T C GAGT GG GAC AT T GT C A 6217 



Qy 6003 CCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGT 6062 

I I I I I I I I I I I I I I I I I I I I I.I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I 
Db 6218 CCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGT 6277 

Qy 6063 GCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGG 6122 

I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
Db 6278 GCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGG 6337 

Qy 6123 ATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGACA 6182 

I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6338 AT GAT GT G GAC GT G GC C AGT GAG C GGCAG CGAGT GC T C C GGGGAGAC G CC GACAAT GAC A 6397 

Qy 6183 T GGT CAAGAT T GAGAAC CT GAC CAAG GT CTAC AAGT CC CG GAAGAT T GGC C GT AT C C T G G 6242 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6398 T GGT CAAGAT T GAGAAC CT GAC CAAG GT CTAC AAGT C C C GGAAGAT T G GC C GT AT C CT GG 6457 

Qy 624 3 CCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCA 6302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 6458 CCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCA 6517 

Qy 6303 AC GGT GC G GG CAAG AC CAGC AC CT T CAAGAT GC T GACC GGC GAC GAGAGC AC GAC GGG GG 6362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 6518 ACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGG 6577 

Qy 6363 G C GAG GCCTTCGT C AAT G GAC AC AG C GT G C T G AAG GAG C T G C T C C AG GT G C AG C A GAG C C 6422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 6578 G C GAGGC CTT CGT C AAT GGAC AC AGC GT G CT GAAGGAG C T GCT C C AGGT GC AGC AGAG C C 6637 

Qy 6423 TCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGC 6482 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 6638 TCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGC 6697 

Qy 64 83 AGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGG 6542 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 669 8 AGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGG 6757 

Qy 6543 CT C T GGAGAAGC T G GAG CT GAC CAAGT AC GC AGACAAGCC G GC T G G CAC C T AC AG CGG C G 6602 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 6758 CT C T GGAGAAGC T G GAG CT GAC CAAGT AC GCAGAC AAG C C GGC T GG CAC CT ACAG C GG C G 6817 

Qy 6603 GCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCC 6662 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I II I I I I II I I 
Db 6818 GCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCC 6877 

Qy 6663 TGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCC 6722 

I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 687 8 T GGAC GAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT CAT CC 6937 

Qy 6723 T CGAC CT CAT CAAGACAGGGCGTT CAGT GGT GCTGACAT CACACAGCAT GGAGGAGT GC G 6782 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6938 T C GAC CT CAT CAAGACAGGGCGTT CAGT GGT GCT GACAT CACACAGCAT GGAGGAGT GCG 6997 

Qy 67 8 3 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 6842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6998 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 7057 

Qy 6843 TCCAGCAC CT GAAGAAC CGGT TTGGAGAT GGCTACATGATCAC GGT GCGGACCAAGAGCA 6902 



Db 7058 T C CAG C AC CT GAAGAAC C GGT T T G GAGAT G GCT AC AT GAT C AC GGT G C G GAC CAAGAG C A 7117 

Qy 6903 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 6962 

I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 
Db 7118 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 7177 

Qy 6963 AGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCC 7022 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 7178 AGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCC 7237 

Qy 7023 AGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCA 7 082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7238 AGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCA 72 97 

Qy 7083 G C CAG AC C AC AC T G G AC AAT GTGTTCGT G AAC T T T G C C AAG AAG CAG AG T G AC AAC C T G G 7142 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7298 GC C AGAC CAC ACT GGACAAT GT GT T C GT GAACT T T G C CAAGAAGCAGAGT GACAAC CT GG 7357 

Qy 7143 AGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCC 72 02 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 7358 AGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCC 7417 

Qy 72 03 TGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGG 7262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 7418 TGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGG 7477 

Qy 72 63 AC CT G GAC AC GGAG GAC GAGG GC CT CAT CAGCT T C GAGGAGGAGC G GGCC C AG CT GT C C T 7322 

I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I 
Db 74 7 8 AC CT G GACAC G GAG GAC GAG G GC CT CAT CAG CT T C GAGGAG GAGC GG G C C CAGCT GT C C T 7537 

Qy 7323 TCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTG 7382 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 7538 TCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTG 7597 

Qy 73 83 ACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCA 7442 

I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 i I I I I I I I I I I I I 1 1 I I 

Db 7598 AC CAC C C AGAG C T GG G C CAGG GAC T CAACAAT G G GGAC AGAAGT C C C C CAGT GCC T GC C A 7 657 

Qy 7443 GGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGC 7502 

I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7658 GGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGC 7717 

Qy 7503 CATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGG 7562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7718 CATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGG 7777 

Qy 7563 GCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCC 7622 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 7778 GCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCC 7837 

Qy 7623 CCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTT 7682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7838 CCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTT 7897 

Qy 7683 TCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGC 7742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



7898 



TCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGC 7957 



Qy 


7743 


Db 


7958 


Qy 


7803 


Db 


8018 


Qy 


7863 


Db 


8078 


Qy 


7923 


Db 


8138 


Qy 


7983 


Db 


8198 



GGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCT 78 02 

I I I I I I I I I I I I I I I I I II I I II I I I I II I I I I I I I I I I I I I I I I I I 

GGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCT 8017 

GGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCT 78 62 
M I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I | | | | | | | | | | | | | | | | | | | | | 
GGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCT 8077 

GGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCC 7922 
I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I | | | I I I I | | | | | | | || | | 
GGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCC 8137 

CAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTG 7982 
I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I 
CTKACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTG 8197 

GGAGCC GGGC CTGT ACAT AGC GCACAGAT GT TTGTTT TAAATAAATAAACAAAAT GT C 8 04 0 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 

G GAGC C GG GC C T GT AC AT AGC G CAC AGAT GT T T GT TT TAAATAAATAAACAAAAT GT C 82 55 
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PC 
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CC Human and rat ABCA2 gene 

FH Key Location/Qualifiers 

FT source 1. .8269 

FT /organism^ Homo sapiens (human)'. 

Location/Qualifiers 
1. .8269 

/organism="Homo sapiens" 
/mol_type="genomic DNA" 



/db_xref="taxon: 9606" 

ORIGIN 

Query Match 100.0%; Score 8036.4; DB 6; Length 8269; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 8037; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

Qy 3 GCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGC 62 

I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I | I I I I I I | | | I 
Do 218 GCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGC 277 

Qy 63 TGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCT 122 

M I I I I I I I I I I I I I I II II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I | I I 
Db 27 8 TGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCT 337 

Qy 123 TCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCT 182 

I I I I I I I I M I I I I I II I I II I I I I I I I I I I I I I I | | M | | | | | | | | | | | | | | | M I II I 

Db 338 TCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCT 397 

Qy 183 CCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTG 242 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I 
Db 398 CCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTG 457 

Qy 243 TCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCA 302 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | M | | I I I I I I I I I I I I 
Db 458 TCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCA 517 

Qy 303 ACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGT 362 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | 
Db 518 ACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGT 577 

Qy 363 TTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGG 422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I I 
Db 578 TTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGG 637 

Qy 423 CCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCT 4 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | I I I I I I I I I I 
Db 638 CCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCT 697 

Qy 483 TCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACT 542 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 698 TCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACT 757 

Qy 543 TGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGG 602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 758 TGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGG 817 

Qy 603 TCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGG 662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I I I I I I I I I I I I 
Db 818 TCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGG 877 

Qy 663 GTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGC 722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 878 GTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGC 937 

QY 723 TGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGA 7 82 
Mini I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 938 TGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGA 997 

Qy 783 TCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCA 842 

I M I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 998 TCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCA 1057 

Qy 843 GTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACC 902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1058 GTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACC 1117 

Qy 903 AGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGACT 962 

I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1118 AGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGACT 1177 

Qy 963 CCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATG 1022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 
Db 1178 CCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATG 1237 

Qy 1023 CCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGG 1082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I 
Db 1238 CCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGG 1297 

Qy 1083 GTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATG 1142 

I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | I | | | | | I | | | | | | | | | | | 
Db 1298 GTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATG 1357 

Qy 1143 GCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTG 1202 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1358 GCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTG 1417 

Qy 12 03 CTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCT 1262 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1418 CTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCT 1477 

Qy 12 63 GGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGC 1322 

I I I I I I I I I I I I I I I II I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1478 GGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGGTGC 1537 

Qy 1323 GGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCC 1382 

I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1538 GGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCC 1597 

Qy 13 83 TCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCG 1442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
Db 1598 TCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCG 1657 

Qy 1443 ACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATG 1502 

I I I I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1658 ACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATG 1717 

Qy 1503 CCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGC 1562 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 
Db 1718 CCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGC 1777 

Qy 1563 AG C AAC AC CTGCGCTGGCTG C AGCAGT AT GT AGC AGAG C T G C G G CT GC AC C C C GAG GC AC 1622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I II I I I I I I I I 

Db 1778 AGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCAC 1837 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1623 TGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCA 1682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
1838 TGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCA 18 97 

1683 GTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCC 1742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 1 I II I 
1898 GTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCC 1957 

1743 AGTT CAT GT CCAAGGTGAGCGT GGAC AT CT T CAAGGGCTTC CCC GACGAGGAGAGCATT G 1802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1958 AGT T CAT GT C CAAGGT GAG C GT GGAC AT C T T CAAGG G CT T C C C C GAC GAGGAGAGC AT T G 2017 

1803 T CAACT AC AC C CT C AAC C AG G C CT AC C AGGACAAC GT CACT GT T T T T GCC AGT GT GAT CT 1862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
2018 T CAAC T AC AC C CT CAAC C AG G C CT AC C AG GACAAC GT CACT GT T T T T GCC AGT GT GAT CT 2077 

1863 TCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACT 1922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
207 8 TCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACT 2137 

1923 CCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATA 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2138 CCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATA 2197 

1983 CTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCG 2042 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I 
2198 CTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCG 2257 

2 043 CCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGT 2102 

I I I I M I I I I I I I I II I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 

225 8 CCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGT 2317 

2103 T C C C CT AC C C C T G CT AC AC AC G C GAT GACT T C CT GT T T GT CAT T GAGC AC AT GAT GC C GC 2162 
I I I I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 
T C C C CT AC C C CT G CT ACACAC G C GAT GACT T C CT GTT T GT CAT T GAGC AC AT GAT G C C GC 



2318 



2377 



2222 



2163 TGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGG 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2378 TGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGG 2437 

2223 AGAAGGAGC AC CGGCT CAAGGAGGT GAT GAAGAC C AT GGGC CT GAACAAC GCGGT GCACT 22 82 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
2438 AGAAGGAG CAC CGGCT CAAG GAG GT GAT GAAGAC CAT GG G C C T GAACAAC GC G GT GCACT 2497 

22 83 GGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCG 2342 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
2498 GGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCG 2557 

2 34 3 CCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCC 24 02 

I I II I I I I II I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2558 CCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCC 2617 

24 03 TGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCA 2462 

II I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 

2 618 TGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCA 2677 



Qy 2463 AGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACA 2522 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2678 AGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACA 2737 

Qy 2523 T GT AC GT GG C GAT C C G AGAGGAGGT G G C GC AT GAT AAGAT C AC G GC C T T C GAGAAGT G C A 2582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 3 8 TGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTGCA 2797 

Qy 2583 TCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATG 2642 

I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I M I I I I I I I II I I I I I I I I I I I I 

Db 2798 TCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATG 2857 

Qy 2643 AGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACG 2702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 2858 AGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACG 2917 

Qy 2703 ACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCC 2762 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2918 ACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCC 2977 

Qy 2763 TCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACT 2822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 978 TCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACT 3037 

Qy 2 823 TCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCT 2 882 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3038 TCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCT 3097 

Qy 2883 GGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGG 2942 

I I I I I I I I I ! I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I. II I I I I I 

Db 3098 GGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGG 3157 

Qy 2 943 AGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGG 3002 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3158 AGAG CCGGCGCTTT GAGGAGAC C C GT GGCAT G GAG GAGGAGC C C AC C C AC CT GCCTCTGG 3217 

Qy 3003 T T GT CT GC GT GGACAAACT CAC CAAGGT C T ACAAG GAC GACAAGAAGCT GGC C CT GAAC A 3062 

I I I I I I I I I I I I II 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3218 T TGTCTGCGT GGACAAACT CAC CAAGGT CTACAAGGAC GACAAGAAGCT GGC CCT GAAC A 3277 

Qy 30 63 AGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGG 3122 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II II I I I I I I 
Db 3278 AGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGG 3337 

Qy 3123 GCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCA 3182 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 3338 GCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCA 3397 

Qy 3183 CCATCTACGGGCACGACAT CCGCACGGAGAT GGAT GAGAT C CGCAAGAACCT GGGCAT GT 3242 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 33 98 C CAT CT AC G G GC AC GAC AT C C GCAC GGAGAT G GAT GAGAT C C GCAAGAAC CT G GG C AT GT 3457 

Qy 3243 GCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACT 3302 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3458 GCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACT 3517 

Qy 3303 CAC G G CT CAAGAGCAT G GCT CAGGAGGAGAT C C GC AGAGAG AT GGACAAGAT GAT C GAGG 3362 



1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3518 CAC GGCT CAAGAGCAT GGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT GAT CGAGG 3577 

Qy 3363 ACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGC 3422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 357 8 AC CT G GAG CT CT C CAAC AAAC G GCAC T C ACT G GT GC AGAC ATT GT C GG GT G GC AT GAAGC 3637 

Qy 3423 GCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGC 34 82 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I 
Db 3638 GCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGC 3697 

Qy 34 83 CCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACA 3542 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 3698 CCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACA 3757 

Qy 3543 AGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGG 3602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3758 AGC CAGG C C GCAC CAT C CT T C T GT CC AC C CACCACAT G GAT GAGG CT GAC CTGCTTGGGG 3817 

Qy 3603 ACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCA 3662 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3818 ACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCA 3877 

Qy 3 663 AGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGG 3722 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3878 AGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGG 3937 

Qy 3723 GCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCT 37 82 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3938 GCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCT 3997 

Qy 3783 CCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAG 3842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3998 CCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAG 4057 

Qy 3843 ACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCG 3902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 058 ACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCG 4117 

Qy 3903 AGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGC 3962 

I I II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4118 AGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGC 417 7 

Qy 3963 T GAT G GAC AC GAC C CT G GAGGAAGT GTT C CT CAAGGT GT C GGAGGAG GAT C AGT C GCT GG 4 022 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 417 8 T GAT G GAC AC GAC C CT G GAGGAAGT GT T C CT CAAGGT GT C GGAGGAG GAT C AGT C GCT GG 4237 

Qy 4023 AGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCC 4082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 4238 AGAACAGT GAGG C C GAT GT GAAGGAGT C CAG GAAGGAT GT GCT C C CT GGG GC GGAGGGCC 4297 

Qy 4083 CGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGC 4142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I 

Db 42 98 CGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGC 4357 

Qy 4143 AGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCT 42 02 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 4358 AGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCT 4417 

Qy 4203 AC AC C G AC GT C T AT G G C G AC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AG AC AAT G 4262 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 4418 AC AC C GAC GT C TAT GG C G ACT AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AG AC AAT G 4 477 

Qy 4263 TCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGC 4322 

I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4478 TCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGC 4537 

Qy 4323 TGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACT 4382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4538 TGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACT 4597 

Qy 4 383 GCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCT 4 442 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 4598 GCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCT 4657 

Qy 4 4 43 GCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCC 4 502 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 658 GCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCC 4717 

Qy 4503 TGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCA 4562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II 
Db 4718 T GT C AC CT T C C C AGT AC C ACAACT AC AC CC AGC C C C GT G GCAATT T CAT C C C C T AC GC C A 4777 

Qy 4563 ACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCG 4622 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4778 ACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCG 4837 

Qy 4623 TGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCA 4682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 838 TGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCA 4 8 97 

Qy 4 683 ACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTC 4742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 
Db 4 8 98 ACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTC 4957 

Qy 4743 GGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCG 4 8 02 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 4958 GGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCG 5017 

Qy 4 8 03 TGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGC 4 862 

I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5018 TGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGC 5077 

Qy 4 8 63 AGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCT 4922 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5078 AGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCT 5137 

Qy 4 923 CCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCT 4 982 

I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 5138 CCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCT 5197 

Qy 4 983 TCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACA 5042 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5198 TCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACA 5257 



Qy 5043 T C CT GAC C GACAT C AC CGGC CACAAT GT CT CT GAGT AC CTGCTCTT C AC C T C C GACC G C T 5102 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52 58 TCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCT 5317 

Qy 5103 TCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCT 5162 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I II I I I I I I I 
Db 5318 TCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCT 5377 

Qy 5163 CATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGG 5222 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 537 8 CATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGG 5437 

Qy 5223 TTTT CTACAACAACAAGGGCTATCACAGCAT GC CCACCTAC CT CAACAGC CT CAACAAC G 5282 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5438 T T T T CT ACAACAAC AAG GGCT AT CAC AG CAT GC C CACCT AC CT CAACAGC CT CAACAAC G 5497 

Qy 5283 CCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCG 5342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 5498 CCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCG 5557 

Qy 5343 TCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGG 54 02 

I I I I I I I I I I I I I I I It I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

Db 5558 T CAC CAAC C ACC C CAT GAATAAGAC C AGC GC C AG CCTCTCCCT GGAT T AC CT G CT GC AG G 5617 

Qy 54 03 GCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCT 54 62 

I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5618 GCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCT 5677 

Qy 5463 TCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCG 5522 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5678 TCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCG 5737 

Qy 5523 GC T GCAAC C C CAT CAT C T ACT G GCT GG C GAACT ACGT GT G G GACAT GC T C AACT ACCT GG 5582 

I I I I I I I I ! I I I I i I I I I I I 1 I I I I I i I 1 I I I I I I I I I I I I I I I I II I I I I I I ! I I I I ! I 

Db 5738 GCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGG 5797 

Qy 5583 TCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGC 5642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5798 TCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGC 5857 

Qy 5643 CCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCA 5702 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 
Db 5858 CCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCA 5917 

Qy 57 03 TCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTG 57 62 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I II I I I I 
Db 5918 TCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTG 5977 

Qy 5763 TCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCG 5822 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 597 8 TCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCG 6037 

Qy 5823 AGC AC GACAAG GAC CT GAAG GT T GT CAAC AGTT AC CT GAAAAG CT GCT T C CT C AT TT T C C 5882 

II I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 

Db 6038 AGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCC 6097 
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Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 



5883 C CAACT ACAAC C T GGGC C AC GG GC T CAT G GAGAT GG CC T ACAAC GAGT ACAT CAAC GAGT 5942 

M I I I I I II I M I I M > I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I II I I 
6098 C CAACT AC AAC C T GGGC CAC GG GC T CAT G GAGAT GG CC T ACAAC GAGT ACAT CAAC GAGT 6157 

5943 ACT AC G C C AAGAT T GG C CAGT T T GAC AAGAT GAAGT C C C C GT T C GAGT G G G AC AT T GT C A 6002 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6158 ACT AC GC C AAGAT T GG C CAGT T T GAC AAGAT GAAGT C C C C GT T C GAGT G G GAC AT T GT C A 6217 

6003 CCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGT 6062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I II I I I I i I I I I I I I I I I I I I I I I I 1 I I 
6218 CCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGT 6277 

6063 GCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGG 6122 

I I I I I I I I I II I I I I I I 11 I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
627 8 GCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGG 6337 

6123 AT GAT GT GGACGT G G C CAGT GAGC GGCAG CGAGT GCT C C G GGGAGAC G C C GACAAT GAC A 6182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6338 ATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGACA 6397 

6183 T G GT C AAGAT T GAG AAC C T GAC C AAG GT C T AC AAG T C C C G G AAGAT T G G C C GT AT C C T G G 6242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II M I 

639 8 T GGT CAAGAT T GAGAAC CT GAC CAAGGT CT ACAAGT C C C G GAAGAT T G GC C GT AT C C T G G 6457 

624 3 CCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCA 6302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
6458 CCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCA 6517 

6303 ACGGT GC GG G CAAGAC C AG CAC CT T CAAGAT GCT GACC GGC GAC GAGAGCAC GAC GGGGG 6362 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6518 AC GGT GC G GG CAAGAC C AG CAC CT T CAAGAT GCT GAC C G GC GAC GAGAGCAC GAC GG G GG 6577 

6363 GCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCC 6422 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I 

657 8 GCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCC 6637 

6423 TCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGC 6482 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 
6638 TCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGC 6697 

6483 AGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGG 6542 

I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6698 AG CT GTACAC G C GGCT G C GTGG GAT CTCCTGGAAG GAC GAGGCCCGGGT GGT GAAGT GGG 6757 

6543 CTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCG 6602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
67 58 CTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCG 6817 

6603 GCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCC 6662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
6818 GCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCC 68 77 

6663 TGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCC 6722 

I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
687 8 TGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCC 6937 

6723 T C GAC CT CAT CAAGACAGG GC GTT C AGT G GT GC T GAC AT CACAC AGC AT GGAG GAGT G C G 6782 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 6938 T C GAC C T CAT C AAGAC AGG GC GTT CAGT GGT GCT GAC AT C AC ACAGC AT GG AG GAGT G C G 6997 

Qy 6783 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 6842 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6998 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 7 057 

Qy 6843 T C C AG C AC C T GAAGAAC C G GT T T G GAG AT G G C T AC AT GAT C AC G GT G C G GAC C AAG AG C A 6902 

I I I II I II I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7058 TCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTGCGGACCAAGAGCA 7117 

Qy 6903 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 6962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 7118 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 7177 

Qy 6963 AGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCC 7 022 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 717 8 AGGAG C GGCAC C AC AC AAAGGT GCAGT ACC AGCT CAAGT C G GAGC AC AT CTCGCTGGCCC 7237 

Qy 7023 AGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCA 7082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 72 38 AGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCA 72 97 

Qy 7083 GCC AGAC CACACT GGACAAT GT GT T C GT GAACT T T GC CAAGAAGCAGAGT GACAAC CT GG 7142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 72 98 GCC AGAC CACACT GGACAAT GT GT T C GT GAACTT T GC CAAGAAGCAGAGT GACAAC CT GG 7357 

Qy 7143 AGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCC 7202 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I t I I II I I I I I I I I I I I I 

Db 7358 AGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCC 7417 

Qy 7203 TGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGG 7262 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 7418 TGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGG 7477 

Qy 72 63 ACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCT 7322 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7478 ACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCT 7537 

Qy 7323 T CAAC AC GGAC AC GCT CT GCT GAC CAC C CAG AG C T GGGCCAG GGAGGAC AC GCT C CACT G 7382 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I II I I I I I I I I I I I I 

Db 7538 T CAACAC GGACACGCT CT GCTGAC CACCCAGAGCT GGGC CAGGGAGGAC ACGCTC CACT G 7597 

Qy 7383 ACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCA 7442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 7598 ACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCA 7 657 

Qy 7443 GGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGC 7502 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
Db 7658 GGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGC 7717 

Qy 7503 CATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGG 7562 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7718 CATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGG 7777 

Qy 7563 GCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCC 7 622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 



Db 



7778 



GCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCC 



7837 



Qy 7 623 CCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTT 7 682 

I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I II I I I M I I I I 
Db 7838 CCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTT 7 897 

Qy 7 683 TCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGC 7742 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 7898 TCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGC 7957 

Qy 7743 GGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCT 78 02 

I I I I I I I I I I I I I I I I I II I I I I I M I I I II I I I I I I I I I M I I M I I I I I I I I I I I I I I 
Db 7958 GGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCT 8017 

Qy 7 8 03 GGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCT 7862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 8 018 GGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCT 8077 

Qy 7 863 GGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCC 7922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I 
Db 8 078 GGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCC 8137 

Qy 7923 CAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTG 7982 

I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8138 CAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTG 8197 

Qy 7983 GGAG C C GG GC CT GTACAT AGC G CAC AGAT GT TT GT T T T AAAT AAATAAACAAAAT GT C 804 0 

I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

Db 8198 G GAGC C GG G C CT GTACAT AGC GCACAGAT GTTTGTTT TAAATAAAT AAACAAAAT GT C 8255 
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AX235951 8195 bp DNA 

Sequence 7 from Patent WO0164875. 
AX235951 

AX235951. 1 GI: 157 95822 



Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Glucksmann, M. A. 

Human transporter genes and proteins encoded thereby 
Patent: WO 0164875-A 7 07-SEP-2001; 
Millennium Pharmaceuticals, Inc. (US) 

Location/Qualifiers 

1. .8195 

/organism= f, Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
132. .7442 

/note="unnamed protein product" 
/ codon_start=l 
/protein_id="CAC8 8245. 1" 
/db xref="GI: 15795823" 



/ db_x r e f = " REMT REMBL : CAC 8 8245" 

/translation="MGFLHQLQLLLWKNWLKRRSPWVLAFEIFIPLVLFFILLGLRQ 
KKPTISVKEVSFYTAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDR 
WEEGNLFDPARPSLGSELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQ 
ELWRFLTQNLSLPNSTAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLG 
GNPLFRMEELLLAPALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAAR 
ARRFS GLSAELRNQLDVAKVSQQLGLDAPNGS DS S PQAP P PRRLQALLGDLLDAQKVL 
Q DVD VL S ALALL L P Q GACT G RT P G P PAS GAG GAAN GT GAGAVMG PNAT AE E GAP S AAA 
LATPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLL 
VH LMT S N P K I L YAP AG S E VD RVI L KAN ET FAFVGN VT H YAQ VWLN I S AE IRSFLEQGR 
LQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAAC 
GWI QFMSKVSVDI FKGFPDEES IVNYTLNQAYQDNVTVFASVI FQTRKDGS LP PHVHY 
KIRQNSSFTEKTNEIRRAYWRPGPNTGGRFYFLYGFVWIQDMMERAIIDTFVGHDWE 
PGSWQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIV7VEKEHRLKEVMK 
TMG LNN AVHWVAW F I T G FVQ L S I S VT ALTAI L K YGQVL I H S HWI I W L FLAVYAVAT I 
MFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAI REEVAHDKITAFEKCIASLMST 
TAFGLGS KYFAL YEVAGVGI QWHT FSQ S P VEGDD FNLLLAVTMLMVDAVVYGI LTW YI 
EAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSW1EEDQACAMESR 
RFEETRGMEEEPTHLPLWCVDKLTKVYKDDKKLALNKLSLNLYENQWSFLGHNGAG 
KTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWF 
YSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAII 
LDEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCG 
SPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHV 
ASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFL 
KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASS 
VGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLK 
VRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQ 
YHNYTQPRGNFIPYANEERREYRLRLS PDAS PQQLVSTFRLPSGVGATCVLKS PANGS 
LGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPS PAPS DS PAS PDEDLQ 
AWNVSLPPTAGPEMWT SAPSLPRLVREPVRCTCSAQGTGFSCPSSVGGHPPQMRWTG 
DILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRR 
AAQVFYNNKG YHSMPT YLN S LNNAI LRANLPKS KGNPAAYGI TVTNH PMNKT S AS LS L 
DYLLQGTDWIAI FI I VAMS FVPAS FWFLVAEKSTKAKHLQFVS GCNPI I YWLANYV 
WDMLN YLVPATCCVI I LFVFDL PAYT S PTN FPAVLS LFLLYGWS I T P IMYPAS FWFEV 
PSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKWNSYLKSCFLIFPNYNLGHGL 
MEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGWGFLLTIMCQYNFLR 
RPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRL 
CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGY 
CPQCDALFDELTAREHLQLYTRLRGISWKDEARWKWALEKLELTKYADKPAGTYSGG 
NKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSWLTSHSMEE 
CEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDWRFFNRNFPE 
AMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKK 
QSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE 
EERAQLS FNTDTLC " 

ORIGIN 

Query Match 99.9%; Score 8032; DB 6; Length 8195; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 8035; Conservative 0; Mismatches 5; Indels 0; Gaps 0; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I 
9 8 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 157 

61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

I I I I I I I I II I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
158 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 217 



Qy 

Db 



121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I! II I I I I I I I I I I I I I I M I I I I I I I 
218 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 277 

181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M II I 
278 CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 337 

241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I M I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

338 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 397 

301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
398 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 457 

361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
458 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGGCCTACGCCAGCATCTGGA 517 

421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 80 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I 
518 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 577 

4 81 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 

I I I I I I I I I I I I I I I I I I I I I I I I II I t I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 
578 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 637 

541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 60 0 

I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
638 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 697 

601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

698 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 757 

661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
758 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 817 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 78 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I M I I 

818 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 877 

7 81 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 8 4 0 

I I I M I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
878 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 937 

841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I II I I II I I I I I I I I I I I I M I I I I I I I I I I 

938 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 997 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 9 60 

I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I M 
998 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1057 



Qy 


961 


CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 

| | | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 




Db 


1058 


1117 


Qy 


1021 


TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 
I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 II 1 II 1 1 1 1 1 1 1 1 
TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 


1080 


Db 


1118 


1177 


Qy 


1081 


GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 

I I I I 1 1 1 1 1 ! 1 1 1 II 1 1 1 1 1 1 1 1 II M 1 1 1 ! 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 


1140 


Db 


1178 


1237 


Qy 


1141 


TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 

| I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 
TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 


1200 


Db 


1238 


1297 


Qy 


1201 


TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 


1260 


Db 


1298 


1357 


Qy 


1261 


CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 

I | | | I I I I I 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 It 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 


1320 


Db 


1358 


1417 


Qy 

Db 


1321 
1418 


GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 


1380 
1477 


Qy 


1381 


CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 
| | I I I M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 
C CT CGT GC AC CT CAT GACCAG CAAC C C CAAAAT C CT GT AC GC G CCTGCGGGCTCT GAGGT 


1440 


Db 


1478 


1537 


Qy 

Db 


1441 
1538 


CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
C GAC C GC GT CAT C C T CAAGGC CAAC GAGACT T TTGCTTTTGTGGG CAAC GT GACT CAC T A 


1500 
1597 


Qy 


1501 


TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 

| || | | | | | I I I I I I I I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 


1560 


Db 


1598 


1657 


Qy 


1561 


GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 
| I I I I I I I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 II 1 1 1 I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
G CAGCAAC AC CT G C G C T GG CT G CAGC AGT AT GT AG CAGAGCT GC G G CT GC AC C C C GAG GC 


1620 


Db 


1658 


1717 


Qy 


1621 


ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 


1680 


Db 


1718 


1777 


Qy 


1681 


CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 

I I | | | | I | M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 


1740 


Db 


1778 


1837 


Qy 

Db 


1741 
1838 


C CAGT T CAT GT C CAAG GT GAGC GT GGAC AT C TT CAAGG GCTTCCCC GAC GAGGAGAG CAT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 
C CAGT T CAT GT C CAAGGT GAG C GT GGAC AT CTT CAAGG G CT T C C C C GAC G AGGAGAGC AT 


1800 
1897 


Qy 


1801 


T GT CAAC T AC AC C CT CAAC C AGG C C T AC C AG GAC AAC GT C ACT GT T T T T G C CAGT GT GAT 


1860 



Db 


1898 


Qy 


1861 


Db 


1958 


Qy 


1921 


Db 


2018 


Qy 


1981 


Db 


2078 


Qy 


2041 


Db 


2138 


Qy 


2101 


Db 


2198 


Qy 


2161 


Db 


2258 


Qy 


2221 


Db 


2318 


Qy 


2281 


Db 


2378 


Qy 


2341 


Db 


2438 


Qy 


2401 


Db 


2498 


Qy 


2461 


Db 


2558 


Qy 


2521 


nk 
VO 




Qy 


2581 


Db 


2678 


Qy 


2641 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

T GT C AACT AC AC C CT C AAC C AG G C CT AC CAG GAC AAC GT C ACT GT T T T T GC C AGT GT GAT 1957 
C T T C C AGAC C C G G AAG G AC GGCTCGCTCCCGCCT CAC GT G C AC T AC AAG AT C C G C C AG AA 1920 

I I I I I I I II I I II I I I I I I I I I I I I M I I I I I I I I M I M I I II I I I I I I I I I I I I I I I I 

CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 2017 
CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I ! 1 I I I ! I I I I i I I I I M I I I I I I I I I M I I I I I I I 

CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2077 

TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 204 0 

I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I ! I I I I I I I I I I 1 I 
TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2137 

CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I MINIM 

CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2197 

GT T C C C CT AC C C CT G CT AC AC AC G C GAT GACT T C CT GT T T GT CAT T GAGC AC AT GAT G C C 2160 

M II I II I M I I I I I I I I I II I I II I M I I M I M I II I I II I I I I I I I II I I I I I I I II 

GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2257 
GCT GT GCAT G GT GAT CTCCTGGGT CT ACT C C GT G GC CAT GAC CAT C CAGC AC AT C GT G GC 222 0 

I I II M I I I I I I I I I I I I I I II II I I I I I I I I I II I II I II I M I I I I I I M I I I II I I I 

GCT GT GCAT GGT GAT CT CCT GGGT CT ACT CC GT G G C CAT GAC CAT C CAGC AC AT C GT G G C 2317 

G GAGAAG GAG C ACC GG CT CAAGGAGGT GAT GAAGAC CAT GGGC CT GAACAAC G C GGT GC A 2280 

|| I I II I I II I II I II I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I II I II I I I II I I 
GGAGAAG GAGCACC G GCT CAAGGAGGT GAT GAAGAC CAT G G GC CT GAACAAC GC GGT G C A 2377 

CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

M I I M I I II I II I M I I I I I I I I I I II I I I I I I I I I I M M I I I M I I II I I I I I I I I I 

CT GGGT GGCCT GGT T CAT CAC CGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACT CAC 2437 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

M II II II M I I I I II I I I I II I I I M II I I I I I I I I II I I M I I M I M I I II I I I I I 
CGCCATCCTGAAGTACGGCCAGGTGCTTATACACAGCCACGTGGTCATCATCTGGCTCTT 24 97 

CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

M II I I I I I II I I M I I I I I II I I I M I I II I I II I I I I I II I I I I I I I II I I I I I I I II 
CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2557 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 252 0 

M I II I I II I I M I I I II I I I II I I M I I II I I I I I II I I I I I I I I I II II I I I I I I I II 
CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2617 

CAT GT AC GT G GC GAT C C GAG AG GAGGT G G C G CAT GAT AAGAT CAC GGCCT T C GAGAAGT G 258 0 

M I I II I II I I I I M I I I I M II I I M I I II I I I I I II II II II I I II I II I I II I I I I I 

CAT GT AC GT G G C GAT C C GAGAGGAGGT G GC GCAT GAT AAGAT CAC G G C CT T C GAGAAGT G 2677 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 64 0 

M I I I I II II II I II I II I I I I I I I I M I I I I II II II I I II I I I I I II I I I I I II I M I 
CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2737 



I II II I II I I II M I I I II II M M I M I M I I I I I II M II II I I I II II II I II I II I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2738 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 27 97 

2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

I I M I I I I I I I II I I I I I I I I I I I I II I I I II I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I 
2798 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2857 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

I || | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2858 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2917 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 8 0 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I 

2918 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2977 

2881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
297 8 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3037 

2941 G GAGAGC CGGC GCT T T GAGGAGAC CC GT GGC AT G GAG GAG GAG CC CAC C CACCT GC C T CT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
3038 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3097 

3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
3098 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3157 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 312 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
315 8 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3217 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I II I I I I I I I I I I I 
3218 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 327 7 

3181 CAC CAT C T AC GGGCAC GACAT C CG CAC G GAGAT GGAT G AGAT C C GCAAGAACCT G GGC AT 3240 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
327 8 CAC C AT CT AC G GGCAC GACAT C C G CAC GGAGAT GGAT GAGAT C CGCAAGAAC CT G GGC AT 3337 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
3338 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3397 

3301 CT CAC GGCT CAAGAGCAT GGCT CAGGAGGAGATCCGCAGAGAGAT GGACAAGAT GAT CGA 3360 

1 I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
3398 CT CAC GGCT CAAGAG CAT GGCT C AGGAG GAGAT C C GC AGAGAGAT GGACAAGAT GAT C GA 3457 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3458 G GAC CT G GAGCT C T C CAACAAAC G GC ACT CACT G GT G C AGACATT GT C GGGT GGC AT GAA 3517 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I 
3518 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3577 

3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 354 0 

I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I II I I I I I I I I I I I I I I I I 
357 8 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3637 



3541 CAAG C C AGGC CG CAC CAT CCTTCTGTC C AC C C AC CAC AT G GAT GAG GC T GAC CT GCT T GG 3600 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

363 8 CAAG C C AGGC C GCAC CAT C CT T CT GT CC AC C CAC CAC AT G GAT GAGG CT GAC CTGCTTGG 3 697 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M 

3698 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3757 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

3758 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3817 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 80 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 

3818 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3 877 

37 81 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

387 8 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3937 

38 41 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

393 8 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3 997 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3998 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4057 

3961 GCT GAT GGACAC GAC C C T GGAG GAAGT GT T C C T CAAGGT GT C G GAGGAGGAT C AGT C GCT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4058 GCT GAT GGACAC GAC C C T GGAG GAAGT GT T C CT CAAGGT GT C GGAGGAGGAT C AGT C GCT 4117 

4021 GGAGAACAGT GAGGC C GAT GT GAAGGAGT CC AGGAAGGAT GT GCT C C CT GGG G CGGAGGG 4080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

4118 GGAGAACAGT GAGGCC GAT GT GAAGGAGT CCAGGAAGGAT GT GCT CC CT GGGGCGGAGGG 4177 

4 081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

417 8 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4237 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4238 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4297 

4201 CT ACAC C GAC GT CT AT G GC GAC T AC CGCCCCCTCTTT GAT AAC C CAC AGGAC C CAG ACAA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

42 9 8 CT ACAC C GAC GT C TAT G GC GAC T AC CGCCCCCT CTT TGAT AAC C CAC AGGAC C CAGACAA 4357 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

4358 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4417 

4 321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4418 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4 477 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

4478 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4537 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4538 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4597 

4501 C C T GT C AC C T T C C C AGT AC C AC AAC T AC AC C C AG CCCCGTGG C AAT T T CAT C C C C T AC G C 4560 

I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I 

4598 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4657 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 620 

I I I II I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

4658 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4717 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 468 0 

I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I II I I I I I I I II I I II I I 

4718 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 477 7 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

4778 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4837 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

48 38 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4897 

4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 860 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 8 98 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 957 

48 61 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 920 

M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4958 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 5017 

4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 498 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

5018 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 507 7 

4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

5078 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5137 

5041 CAT C CT G AC C GAC AT C AC C G GC CACAAT GT CT CT GAGT AC CTGCTCTT C AC CT CC GAC C G 510 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5138 CAT CC T GAC CGACAT C AC C GGC CACAAT GT CT C T GAGT AC CT GCT CT T CAC CT CC GAC C G 5197 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I M I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5198 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5257 

5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 522 0 

I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I 

5258 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5317 

5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5280 



Ill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 

Db 5318 G GT T T T CT AC AACAACAAGG GC T AT CAC AG CAT G C C CAC C T AC CT CAAC AGCC T CAACAA 5377 

Qy 52 81 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5378 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5437 

Qy 5341 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5400 

I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I II II I I I I I I I I I I I | I I I 
Db 5438 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5497 

Qy 5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I II I I I I 
Db 54 98 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5557 

Qy 54 61 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5558 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5617 

Qy 5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 558 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5618 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5677 

Qy 5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 5678 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5737 

Qy 5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5738 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5797 

Qy 5701 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5798 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5857 

Qy 5761 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5858 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5917 

Qy 5821 C GAG CAC G AC AAG G AC C T G AAG G T T G T CAAC AG T T AC C T G AAAAG CTGCTTCCT CAT T T T 588 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I 
Db 5918 C GAGC AC GACAAG GAC CT GAAG GT T GT CAACAGT T AC C T GAAAAG CT GCTT C CT C AT TT T 5977 

Qy 5881 C C C CAACT ACAAC C T G GGCCAC GGGC T CAT GGAGAT GGC C T ACAAC GAGT ACAT CAAC GA 5940 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5978 CCCCAACTACAACCTGGGCCACGGGCT CAT GGAGAT GGC CTACAACGAGT ACAT CAAC GA 6037 

Qy 5941 GT ACT AC GC CAAGAT T GGCCAGTT T GACAAG AT GAAGT C CC C GT T C GAGT G GGACAT T GT 6000 

I I II I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 6038 GT ACT AC GC CAAGAT T G GCCAGTT T GACAAGAT GAAGT C C C C GT T C GAGT G GGACAT T GT 6097 

Qy 6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6098 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6157 



Qy 



6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
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Db 
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Db 
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Db 

Qy 

Db 

Qy 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 



615 8 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6217 

6121 G GAT GAT GT G G AC GT G G C C AG T GAG C G G C AG C GAG TGCTCCGGG GAG AC G C C G AC AAT G A 6180 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I i I I I I I II I I I I I I I I I I I I I I I I I I I 

6218 GGAT GAT GT G GAC GT G GC C AGT GAG C GG C AG C GAGT G CT C C G G G GAGAC G C C GACAAT GA 6277 

6181 CAT GGT CAAGATT GAGAAC CT GAC CAAGGTCTACAAGT CCCGGAAGATTGGC CGTATCCT 62 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAT GGT CAAGATT GAGAAC CT GAC CAAGGT CTACAAGT C C CGGAAGATTGGC CGTAT CCT 



6278 



6337 



6241 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

I I I I I II I I I II I I I I I I I II I I I t I I I I I II I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 
6338 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 



6397 



6301 CAAC GGT GC GGGCAAGAC C AGC AC C T T CAAGAT GCT G AC C GGC GAC GAGAG C AC GAC G GG 6360 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

63 98 C AACGGT GC GG GCAAGAC C AGCAC C T T CAAGAT GCT GAC C GG C GAC GAGAGCAC GAC G GG 6457 

6361 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 642 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I 

6458 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6517 

6421 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6518 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6577 

648 1 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6540 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I I II I I I I I I I I I I I I I I 

657 8 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6637 

6541 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6638 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6697 

6601 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

6698 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6757 

6661 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6758 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6817 

6721 CCT CGACCT CAT C AAGACAGGGC GTT CAGT GGT GCT GACAT CACACAGC AT GGAGGAGT G 67 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6818 CCT CGACC T CAT CAAGAC AGGG C GTT CAGT GGT GC T GACAT CACACAGC AT G GAG GAGT G 6877 

6781 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6840 

I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 

687 8 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6937 

6841 CAT CCAGCACCTGAAGAACCGGTTTGGAGAT GGCTACAT GAT CACGGT GC GGACCAAGAG 6900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 

6938 CAT CCAGCACCTGAAGAACCGGTTTGGAGAT GGCTACAT GAT CAC GGT GCGGACCAAGAG 6997 

6901 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 6960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6998 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 7 057 



Qy 6961 CAAGGAGC GGCAC CAC ACAAAGGT GCAGTAC CAGCT CAAGT CGGAGCACAT CT C GCT G GC 7020 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I > I I I I M I I I I I I I I I I I I I 

Db 7058 CAAGGAGCGGCACCACACAAAGGT GCAGTAC CAGCT CAAGT CGGAGCACAT CTCGCTGGC 7117 

Qy 7 021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7080 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I I I I 

Db 7118 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7177 

Qy 7 081 CAGCCAGAC CAC ACT GGACAAT GT GTT C GT GAACT TT GCCAAGAAGCAGAGT GACAAC CT 714 0 

M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 7178 CAGC C AGAC CAC ACT G GAC AAT GT GT T C GT GAACT T T GC CAAGAAGC AGAGT GACAAC C T 7237 

Qy 7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 7238 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7297 

Qy 7201 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II 
Db 72 98 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7357 

Qy 7261 GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7320 

I I II I I I I I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
Db 7358 GGACCT GGACAC GGAGGACGAGGGCCTCAT CAGCTT CGAGGAGGAGC GGGC C CAGCT GT C 7417 

Qy 7321 CT T CAAC AC GGACAC GCT CT GCT GAC CAC C C AG AGCT GGGC CAGG GAGGACAC GCT C CAC 738 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7418 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7477 

Qy 7381 T GAC C AC CC AGAG CT G GG C C AGGG ACT CAACAAT GGG GAC AGAAGT C C C C CAGT G C CT G C 744 0 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 747 8 T GAC CAC C C AGAGCT GG GC C AG GGACT CAACAAT G GG GACAGAAGT C CC CC AGT G C CT G C 7537 

Qy 7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I II I I I I I I 
Db 7538 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7597 

Qy 7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 7598 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7657 

Qy 7561 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7620 

I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 
Db 7658 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7717 

Qy 7 621 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7680 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I 
Db 7718 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7777 

Qy 7681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7740 

M I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 

Db 77 78 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7 837 

Qy 7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7800 

I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 7838 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7897 



Qy 78 01 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 78 60 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 
Db 7898 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7957 

Qy 7 8 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 792 0 

I I I I I I I II I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I II I I I I I I II I I I I I I I I 
Db 7958 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 8017 

Qy 7 921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7980 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8018 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCCCCTCCC 8077 

Qy 7981 T GGGAGC CGGGCCT GT ACATAGCGCAC AGAT GTTT GT TT T AAATAAATAAACAAAAT GT C 804 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I 
Db 807 8 TGGGAGCCGGGCCTGTACATAGGGCACAGATGTTTGTTTTTAATAAATAAACAAAATGTC 8137 
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/organism="Homo sapiens" 
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/db_xref="taxon: 9606" 
/note="Incyte ID No: 7078207CB1" 



ORIGIN 



Query Match 93.6%; Score 7529.2; DB 6; Length 7610; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 7531; Conservative 0; Mismatches 3; Indels 0; Gaps 



0; 



Qy 

Db 



1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I I I I I I I I I I I I I I I I I I 1! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
77 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 136 



Qy 

Db 



61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
137 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 196 



Qy 


121 


Db 


197 


Qy 


181 


Db 


257 


Qy 


241 


Db 


317 


Qy 


301 


Db 


377 


Qy 


361 


Db 


437 


Qy 


421 


Db 


497 


Qy 


481 


Db 


557 


Qy 


541 


Db 


617 


Qy 


601 


Db 


677 


Qy 


661 


Db 


737 


Qy 


721 


Db 


797 


Qy 


781 


Db 


857 


Qy 


841 


Db 


917 


Qy 


901 


Db 


977 


Qy 


961 



CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I I I | I I M I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 256 

CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCCGTGAAGG7VAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 316 

TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 376 

CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 4 36 

GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 
I I I I II II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II II I II I I 
GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 4 96 

GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 556 

CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCA7WV 54 0 

I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 616 

CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I 
CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 67 6 

GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 
GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 736 

GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 72 0 

I | | | | | | | | | I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I 
GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 7 96 

GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 856 

GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 916 

CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGG7\A 900 

I M M I II I I I I II I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 97 6 

CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

| | | M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1036 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 



Db 


1037 


Qy 


1021 


Db 


1097 


Qy 


1081 


Db 


1157 


Qy 


1141 


Db 


1217 


Qy 


1201 


Db 


1277 


Qy 


1261 


Db 


1337 


Qy 


1321 


Db 


1397 


Qy 


1381 


Db 


1457 


Qy 


1441 


Db 


1517 


Qy 


1501 


Db 


1577 


Qy 


1561 


Db 


1637 


Qy 


1621 


Db 


1697 


Qy 


1681 




1757 


Qy 


1741 


Db 


1817 


Qy 


1801 



I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 



1096 



TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

II I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1156 

GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 
I I I I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I 
GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1216 

TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1276 

TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I II I I I II I I I I I 

TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 133 6 

CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1396 

GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I II 
GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1456 

CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1516 

CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 157 6 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

M I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1636 

G C AGC AAC AC CTGCGCTGGCTG C AG C AGT AT GT AG C AGAG CT GC G G CT G C AC C C C GAG G C 1620 
I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1696 

ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 168 0 

I I I I I I I M I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1756 

CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1816 

C C AGT T CAT GT C C AAG GT GAG C GT GG AC AT C T T C AAG GGCTTCCCC G AC GAG GAG AG CAT 18 00 

I I 1 I I I I II I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I M I I I 
CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 187 6 

T GT C AAC T AC AC C C T C AAC C AG G C CT AC C AG G AC AAC G T C ACT GT T T T T G C C AGT GT GAT 1860 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1877 TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 1936 

1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I i I I I I I I I I I I I I I I I 
1937 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1996 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1997 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2056 

1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 040 

I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I 
2057 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2116 

2041 C GC C AT CAT C GACACT T T T GT G GGG C AC GAC GT GGT G GAG C CAGG C AGCT AC GT GC AGAT 2100 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I 1 I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 
2117 C G C CAT CAT C GACACT T T T GT G GGG C AC GAC GT GGT G GAG C CAGG C AG CT AC GT GC AGAT 217 6 

2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2177 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2236 

2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 222 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M M 1 I I I I I I I I I I I I I I I I I I I I I I 
2237 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 22 9 6 

2221 GGAGAAGGAGCAC C GGCT C AAG GAGGT GAT GAAGACC AT GGG C CT GAACAAC GCG GT G C A 22 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I 

2297 GGAGAAGGAGCAC C GG C T CAAG GAG GT GAT GAAGACCAT GGGC C T GAACAAC GC G GT G C A 2356 

2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2357 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2416 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 
2417 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 247 6 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 60 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2477 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2536 

24 61 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2537 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 25 9 6 

2521 CAT GT ACGT GGC GAT C C GAGAGGAGGT GG C GC AT GAT AAGAT C AC GGC CT T C GAGAAGT G 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2597 CAT GT AC GT G GCGAT C C GAGAG GAGGT GGC G CAT GAT AAGAT C AC GGC CT T C GAGAAGT G 2656 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 
2657 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2716 

2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 27 0 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

2717 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2776 
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2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2777 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2 836 

27 61 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 282 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2837 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2896 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 80 

I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

2 8 97 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2956 

2 8 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 940 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I 
2 957 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3016 

2941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 II I I I I I I I I I 
3017 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3076 

3001 G GT T GT CT GC GT G GACAAACT C AC CAAGGT C T ACAAG GAC GACAAGAAGCT G G CC CT GAA 3060 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3077 G GT T GT CT GC GT GGACAAACT CAC CAAGGT C T ACAAG GAC GACAAGAAGCT G G CC CT GAA 3136 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3137 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3196 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
3197 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3256 

3181 CAC CAT CT ACGGGCACGACAT CCGCACGGAGATGGAT GAGAT C CGCAAGAACCTGGGCAT 3240 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 
3257 CAC CAT CT AC G G GC AC GACAT C C GC AC GGAGAT GGAT GAGAT C C GC AAGAAC CT GG G CAT 3316 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3317 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3376 

3301 CTCACGGCTCAAGAGCATGGCT CAGGAGGAGATCCGCAGAGAGAT GGACAAGATGATCGA 3360 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I 

3377 CTCACGGCT CAAGAGCAT GGCTCAGGAGGAGATCCGCAGAGAGATGGACAAGATGATCGA 3436 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

3437 G GACC T G G AGC T CT C CAAC AAAC GGC ACT CACT G GT G C AGAC AT T GT C GG GT G GC AT GAA 34 96 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

I II I I II I I I M I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I 
34 97 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3556 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3557 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3616 
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3541 CAAGC CAG GC C GC AC CAT CCTTCTGTC C AC C C AC C AC AT G GAT GAGG C T GAC CTGCTTGG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

3617 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3 67 6 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I II I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

3677 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 373 6 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I II I I I I II I I I I 

3737 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 37 96 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I 

3797 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3 856 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

3857 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3916 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II I II I I I I I I I I I I I I I 

3917 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 397 6 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

3977 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4 036 

3961 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4020 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4037 GCT GAT GGAC AC GAC C C T GG AGGAAGT GT T C C T CAAG GT GT C G GAGGAG GAT C AGT C G C T 4096 

4021 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4 080 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4097 G GAGAACAGT GAGG C C GAT GT GAAGGAGT C C AGGAAGGAT GTGCTCCCTGGGGCG GAGGG 4156 

4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

I || I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4157 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4216 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4217 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4276 

4201 CTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCAGACAA 42 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I 

4277 CT AC ACC GAC GT CT AT GGC GAC T ACC GC CC C CT C T T T GAT AAC C CAC AGGAC C CAGAC AA 4 336 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I I I II I I I I I I I I I 

4337 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4 3 96 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4 3 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

4397 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4 456 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 44 4 0 
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1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

4457 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4516 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 
4517 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4576 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4 560 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I II I I 
4577 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4 636 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
4637 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4696 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 68 0 

I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 697 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4756 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 74 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
4757 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 816 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 800 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
4817 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 876 

4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4877 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 936 

4 8 61 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 920 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4937 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 996 

4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4 98 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 
4997 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 5056 

4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5057 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5116 

5041 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5117 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5176 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5177 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5236 

5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 522 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5237 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5296 

5221 G GT T T T C T AC AAC AAC AAG G G C TAT C AC AGC AT G C C C AC CT AC C T C AAC AG C C T C AAC AA 5280 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I 
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5297 GGT T TT CT AC AACAACAAG GGC TAT C ACAGC AT GC C C ACCT AC C T C AAC AG C C T CAACAA 5356 

5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5340 

I I I 1 I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5357 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5416 

5341 C GT C AC CAAC CAC C C CAT GAAT AAGAC CAGC GC C AGC CT CT C C CT GGAT T AC CT GCTG C A 54 00 

I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
5417 CGTCACCAACCACCCCATGAAT AAGAC CAGC GCCAGCCTCTCCCTGGATT ACCT GCTGCA 5476 

5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 54 60 

I II I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
5477 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5536 

5461 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I II I I I I I 
5537 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 



5596 



5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

5597 CGGCTGCAACCCCAT CAT CT ACT GGCTGGCGAACTACGTGTGGGACATGCTCAACT ACCT 5 656 

55 81 GGTCCCCGCTACCTGCTGTGTCATCAT'CCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 

5657 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5716 

5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 57 00 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5717 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5776 

57 01 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 57 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I II I 

5777 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5836 

5761 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

I I I I II M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

5837 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5896 

5821 C GAGC AC GAC AAG GACCT GAAGGT T GT CAAC AGT T AC CT GAAAAGCT GCT T C C T CATT T T 5880 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

5897 C GAGCACGACAAGGACCT GAAGGT T GT CAAC AGT T AC CT GAAAAGCT GCT T C C T CATT T T 5956 

5881 C C C CAAC T AC AAC C T G G G C CAC G G G C T CAT G GAG AT G G C C T AC AAC G AGT AC AT CAAC G A 5940 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

5957 CCCCAACTACAAC CT GGGC CAC GGGCT CATGGAGAT GGCCTACAACGAGT ACAT CAAC GA 6016 

5941 GT ACT AC GC C AAGAT T GGC CAGTT T GACAAG AT GAAGT C C C C GT T CGAGT GG GAC ATT GT 6000 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I I I I I I I II I II I I II 

6017 GT ACT ACGC CAAGAT T GGC CAGTT T GACAAGAT GAAGT C C CC GT T C GAGT GG GACATT GT 6076 

6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6077 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6136 

6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

6137 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6196 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



6121 GGAT GAT GT G GAC GTGGC CAGT GAG C G GC AG C GAGT GC T C C GGG GAGACG C C GACAAT GA 618 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
6197 GGAT GAT GT G GAC GT GG C CAGT GAG C G G CAG C GAGT G C T C C G G GGAGAC GC C GACAAT G A 6256 

6181 CAT GGT C AAGAT T GAGAAC CT GAC CAAGGT CT AC AAGT C C C G GAAGAT T G GC C GT AT C C T 6240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
6257 CAT GGT C AAGAT T GAGAAC CT GAC CAAGGT CT ACAAGT C C C G GAAGAT T G GC C GT AT C CT 6316 

6241 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
6317 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6376 

6301 CAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGG 6360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6377 CAACGGT GC G GGCAAGAC C AGC AC CT T CAAGAT GCT GAC C GGC GAC GAGAGC AC GAC GGG 6436 

6361 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6420 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
6437 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 64 96 

6421 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 64 80 

I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
64 97 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6556 

6481 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 654 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6557 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6616 

6541 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6617 GGC T CT GGAGAAG CT G GAG CT GAC CAAGT AC G CAGAC AAGC C GG C T G GCAC C T ACAGC G G 667 6 

6601 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6677 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6736 

6661 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 672 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
6737 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6796 

6721 CCTCGACCTCATCAAGACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTG 678 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
6797 CCT CGAC C T CAT CAAGACAGG GC GT T CAGT G GT GCT GACAT C AC ACAGCAT G GAGGAGT G 685 6 

6781 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 68 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
68 57 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6916 

6841 CAT CCAGCACCTGAAGAAC CGGTTT GGAGAT GGCTACAT GAT CACGGT GC GGACCAAGAG 6900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
6917 CAT CCAGCAC CTGAAGAACCGGTT T GGAGAT GGCTACAT GAT CACGGT GC GGACCAAGAG 697 6 

6901 C AGC C AGAGT GT GAAGGAC GT GGT GC G GT T C T T CAAC C G C AACTT C C C GGAAG CC AT G CT 6960 

I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
6977 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 7036 



Qy 


6961 


Db 


7037 


Qy 


7021 


Db 


7097 


Qy 


7081 


Db 


7157 


Qy 


7141 


Db 


7217 


Qy 


7201 


Db 


7277 


Qy 


7261 


Db 


7337 


Qy 


7321 


Db 


7397 


Qy 


7381 


Db 


7457 


Qy 


7441 


Db 


7517 


Qy 


7501 


Db 


7577 



C7WVGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7020 

I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 

CAAGGAG C G G CAC CACACAAAGGT GC AGT AC C AG CT CAAGT C G GAGCAC AT CTCGCTGGC 7096 

CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7080 

I I I II I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I 
CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7156 

C AGC C AGAC CAC ACT GGAC AAT GT GT T C GT GAACT T T G C CAAGAAG CAGAGT GACAAC CT 7140 
I I I I I I I I I I I I I I I I II I I I I II I I I I I M I I I I I I I I I I I I I I I I I I) I I I I I I I I I I 
CAG C C AG AC CAC ACT GGACAAT GT GT T C GT GAACTT T GC CAAGAAG CAGAGT GACAAC CT 7216 

GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 72 00 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I 
GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7276 

CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7336 

GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 732 0 
I I I I I I I I I I I I I I I I I I II I I I I 1 I I I I I I I I I I I M I I I 1 I I I I I I I I I I I II I I I I I 
G GAC CT G GAC AC GGAGGAC GAG GG C CT CAT CAG C TT C GAG GAG GAGC GGGC C CAG CT GT C 7396 

CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 738 0 

I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7456 

T GAC CAC C C AGAG CT G GGC CAG GGACT CAACAAT GGGGAC AGAAGT C C C C C AGT GC CT GC 7440 
I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GAC CAC C C AGAGCT GGGC CAGG GACT CAACAAT G G GGAC AGAAGT C C C C C AGT G CCT G C 7516 

CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7576 

GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCT 7534 

I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I 
GCCATGTCCTGCGGTCACTGCGGTTGCCGGCCCT 7 610 
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Homo sapiens ABC transporter ABCA2 (ABCA2) mRNA, complete cds . 
AF327657 

AF327657.1 GI:13173185 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
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in macrophages 

JOURNAL Biochern. Biophys . Res. Commun. 281 (1), 249-258 (2001) 
MEDLINE 21092814 
PUBMED 11178988 
REFERENCE 2 (bases 1 to 7482) 
AUTHORS Kamins ki , W . E . 
TITLE Direct Submission 

JOURNAL Submitted ( 12-DEC-2000 ) Institute for Clinical Chemistry and 
Laboratory Medicine, University of Regensburg, FJS Allee 11, 
Regensburg 93042, Germany 
FEATURES Location/Qualifiers 
source 1. .7482 

/organism= M Homo sapiens" 
/mol_t ype= "mRNA" 
/db_xref="taxon:9606" 
/ ch r omo s ome= " 9 " 
/map="9q34" 
gene 1. .7482 

/gene="ABCA2 " 
CDS 7. .7317 

/gene="ABCA2 " 
/ codon_start=l 

/product="ABC transporter ABCA2 " 
/protein_id="AAK14334 . 1" 
/db_xref="GI : 13173186" 

/trans la tion= "MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQ 
KKPTISVKEVPFYTAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLDR 
WEEGNLFDPARPSLGSELEALRQHLEALSAGPGTSGSHLDRSTVSSFSLDSVARNPQ 
ELWRFLTQNLSLPNSTAQALLAARVDPPEVYHLLFGPSSALDSQSGLHKGQEPWSRLG 
GNPLFRMEELLLAPALLEQLTCTPGSGELGRILTVPESQKGALQGYRDAVCSGQAAAR 
ARRFSGLSAELRNQLDVAKVSQQLGLDAPNGSDSSPQAPPPRRLQALLGDLLDAQKVL 
Q DVDVL S ALAL L L P Q GACT G RT P G P PAS GAG GAAN GT GAGAVMG PN AT AEE GAP S AAA 
LATPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLL 
VHLMTSNPKILYAPAGSEVDRVILKANETFAFVGNVTHYAQVWLNISAEIRSFLEQGR 
LQQHLRWLQQYVAELRLHPEALNLSLDELPPALRQDNFSLPSGMALLQQLDTIDNAAC 
GWIQFMSKVSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVIFQTRKDGSLPPHVHY 
KI RQNS S FTEKTNEI RRAYWRPGPNTGGRFYFLYGFVWIQDMMERAI I DTFVGHDWE 
PGSYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMK 
TMGLNNAVIiWAWFITGFVQLSISVTALTAILKYGQVLMHSHWIIWLFLAVYAVATI 
MFCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMST 
TAFGLGS KYFALYEVAGVGI QWHT FSQS P VE G D D FN L L LA VTMLMVD AWY G I LTWYI 
EAVHPGMYGLPRPWYFPLQKSYWLGSGRTEAWEWSWPWARTPRLSVMEEDQACAMESR 
RFEETRGMEEEPTHLPLWCVDKLTKVYKDDKKLALNKLSLNLYENQWSFLGHNGAG 
KTTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDRLTVEEHLWF 
YSRLKSMAQEEIRREMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAII 
LDEPTAGVDP YARRAIWDLI LKYKPGRT I LLSTHHMDEADLLGDRI AI I SHGKLKCCG 
SPLFLKGTYGDGYRLTLVKRPAEPGGPQEPGLASSPPGRAPLSSCSELQVSQFIRKHV 
ASCLLVSDTSTELSYILPSEAAKKGAFERLFQHLERSLDALHLSSFGLMDTTLEEVFL 
KVSEEDQSLENSEADVKESRKDVLPGAEGPASGEGHAGNLARCSELTQSQASLQSASS 
VGSARGDEGAGYTDVYGDYRPLFDNPQDPDNVSLQEVEAEALSRVGQGSRKLDGGWLK 
VRQFHGLLVKRFHCARRNSKALFSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQ 
YHN YT Q P RGN FI P YAN E E RRE YRL RLSP DAS PQQLVSTFRLPSGVGATCVTjKS PANGS 
LGPTLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPASPDEDLQ 
AWNVS L P PTAG P EMWT SAP S L P RLVRE P VRCT C S AQGT GFS CPS S VGGH P P QMRWT G 
DILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVLKSIPASFGTRAPPMVRKIAVRR 
AAQVFYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSL 
DYLLQGTDWIAIFIIVAMSFVPASFWFLVAEKSTKAKHLQFVSGCNPIIWLANYV 



WDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEV 
PSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKWNSYLKSCFLIFPNYNLGHGL 
MEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMAVEGWGFLLTIMCQYNFLR 
RPQRMPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRL 
CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKELLQVQQSLGY 
CPQCDALFDELTAREHLQLYTRLRGISWKDEARWKWALEKLELTKYADKPAGTYSGG 
NKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSWLTSHSMEE 
CEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQSVKDWRFFNRNFPE 
AMLKERHHTKVQYQLKSEHISLAQVFSKMEQVSGVLGIEDYSVSQTTLDNVFVNFAKK 
QSDNLEQQETEPPSALQSPLGCLLSLLRPRSAPTELRALVADEPEDLDTEDEGLISFE 
EERAQLSFNTDTLC" 



ORIGIN 



Query Match 93.1%; Score 7482; DB 9; Length 7482; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 7482; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 2 9 CCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAA 8 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1 CCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAA 60 

Qy 89 CGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATC 14 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 
Db 61 CGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATC 12 0 

Qy 14 9 CTGCTGGGGCTGCGACAGAAGAAGCCCACCATCTGCGTGAAGGAAGTCCCCTTCTACACA 208 

I I I I I I I I 11 I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CTGCTGGGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACA 180 

Qy 2 09 GCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGC 2 68 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I 
Db 181 GCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGC 24 0 

Qy 269 CAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAG 328 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAG 300 

Qy 32 9 CGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGC 38 8 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 301 CGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGC 360 

Qy 389 TCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCG 44 8 

I I M I I I I I 1 I I I I I I I I I I I I 1 I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 TCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCG 420 

Qy 449 GGGAGCCACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAAC 508 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I 
Db 421 G G GAG C CAC C T GGAC AGAT CC ACAGT GTCTTCCTTCTCTCTG GAC T C GGT GG CC AGAAAC 4 80 

Qy 509 CCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAA 568 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 CCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAA 540 

Qy 569 GCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCA 628 

I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I 

Db 541 GCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCA 600 



Qy 62 9 TCTGCCCTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGG 688 

I I I | | 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I 
Db 601 TCTGCCCTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGG 660 

Qy 68 9 GGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTC 74 8 

M | | | | | | | I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTC 72 0 

Qy 74 9 ACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAG 8 08 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 721 ACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAG 7 80 

Qy 809 GGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGG 8 68 

I I I I I I I I I I I I I I II I I t I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I II I I I I I I I 
Db 781 GGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGG 840 

Qy 869 CGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAG 92 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I II I I I I I 

Db 841 CGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAG 900 

Qy 929 CAGCTGGGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGG 9 88 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 901 CAGCTGGGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGG 960 

Qy 98 9 AGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGAT 104 8 

I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I 1 
Db 961 AGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGAT 102 0 

Qy 104 9 GTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGA 1108 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 GTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGA 108 0 

Qy 1109 CCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGC 1168 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 CCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGC 1140 

Qy 1169 CCCAACGCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACG 1228 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1141 CCCAACGCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACG 1200 

Qy 122 9 CTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGT 1288 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I 
Db 1201 CTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGT 1260 

Qy 12 8 9 GGCAACAACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGC 1348 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
Db 1261 GGCAACAACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGC 1320 

Qy 1349 T T C AC GAG CAAG GAGC AGC G GAAC CTGGGCCTCCTCGT GCAC C T CAT GAC C AG CAAC C C C 1408 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I M II I I I I I I I I I I I I I I I I 
Db 1321 T T CAC GAG CAAG GAG C AGC GGAAC CTGGGCCTCCTCGTG C AC CT C AT GAC C AG CAAC C C C 1380 

Qy 1409 AAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAG 1468 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I 
Db 1381 AAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAG 1440 

Qy 1469 ACTTTTGCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCG 1528 
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1 1 1 M 1 1 l 1 1 1 1 1 1 1 1 II I I 1 1 l I 1 1 I I ll l 1 1 l 1 1 1 1 l I I I I 1 1 I 1 1 1 1 l l l 1 1 1 1 I II 

1441 ACTTTTGCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCG 1500 

1529 GAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAG 1588 

I I I I I I I I I I I I I I I I I I I I I I I I II M II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
1501 GAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAG 1560 

1589 TATGTAGCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCG 1648 

I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 TAT GT AGCAGAGCT GCGGCT GC AC CC CGAGGCACT GAACCT GT CACT GGAT GAGCT GC C G 1620 
1649 CCGGCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTG 1708 

I I I I I I II I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1621 CCGGCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTG 168 0 

17 09 GAT AC CAT T GACAAC GC GGC C TGCGGCTG GAT C C AGT T CAT GT C CAAGGT GAG CGT G G AC 1768 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 GAT AC CAT T GACAAC GC GG C C T GC GGCT GGAT C C AGT T CAT GT C CAAGGT G AGC GT G GAC 174 0 

1769 ATCTTCAAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTAC 182 8 

I I I I M I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I 

1741 ATCTTCAAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTAC 18 00 
182 9 CAGGACAACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTC 18 8 8 

I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1801 CAGGACAACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTC 1860 

1889 CCGCCTCACGTGCACTACAAGATCCGCCAGAACTCCAGCTTCACCGAGAAAACCAACGAG 1948 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1861 C C GC CT C AC GT G C ACT ACAAGAT C C G C C AGAACT C CAG CT T CAC C GAGAAAAC CAAC GAG 192 0 

1949 ATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTAC 2008 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 ATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTAC 1980 

2009 GGCTTCGTCT GGAT C C AGGAC AT GAT GG AGC G C G C CAT CAT C GAC ACT T T T GT GGGGC AC 2068 

I M I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I 

1981 GGCTTCGTCT GGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCAC 204 0 

2069 GACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGAT 2128 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I M I I I I I I I I I I I I I I I I I I I 
2041 GAC GT GGT GGAG C C AG GCAGCT AC GT GC AGAT GT T C C C CT ACC CCT G C T AC AC AC GC GAT 2100 

2129 GACTTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTAC 218 8 

I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I 
2101 GACTTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTAC 2160 

2189 T C C GT GG C CAT GAC C AT CC AGC AC AT CGT GGC GGAGAAG GAGCAC C GGCT C AAGGAGGT G 2248 

I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 T C C GT GGCC AT GAC C AT CC AG CAC AT C GT GG CG GAGAAGGAGC AC C GGCT CAAGGAGGT G 2220 

224 9 ATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTT 2308 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I II I I II I I 
2221 ATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTT 22 8 0 



2309 GTGCAGCTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTT 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M M I I I I I M 
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Db 
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22 81 GTGCAGCTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTT 234 0 

2369 ATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATC 242 8 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2341 ATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATC 2400 

2429 ATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGT 2488 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I 
2401 ATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGT 2460 

248 9 G G CAT CAT C T AC T T C CT GAG C T AC GT GC C CT AC AT GT AC GT G G C GAT C C GAG AGG AGGT G 2548 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2461 G G CAT CAT C T AC T T C CT GAG C T AC GT G C C C T AC AT GT AC GT G G C GAT C C G AGAG GAGGT G 2520 

254 9 G CGC AT GAT AAGAT CAC G GC C T T C G AGAAGT GCAT C GC GT CC C T CAT GT CC AC GAC GG C C 2 608 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2521 G CGC AT GAT AAGAT CAC G G C CT T C G AGAAGT GCAT C GC GT C C C T CAT GT C CAC GAC GG C C 2 58 0 

2 609 TTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGG 2 668 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I I I I I M I I I I I I I I II I 

2581 TTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGG 2 64 0 

2669 CACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACC 272 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 

2 641 CACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACC 2 7 00 

2729 ATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCAC 2788 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2701 AT GC T GAT GGT G GAC GC C GT GGT C TAT G G CAT C CT CAC GT GGT ACAT T GAGG CT GT GC AC 27 60 

27 89 CCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTG 2 84 8 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
2761 CCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTG 2 82 0 

2849 GGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTC 2908 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
2821 GGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTC 2880 

2909 AGT GT C AT GGAG GAGGACC AGG C C T GT G C C AT GGAGAG CC GGCGCT T T GAG GAGAC C C GT 2 968 
I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I 

28 81 AGT GT CAT GGAG GAGGAC C AGG CCT GT G C CAT GGAGAG C C GGC GCT T T GAG GAGAC C C GT 2 94 0 

2969 GGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAG 3028 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
2941 GGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAG 3000 

302 9 GT CT ACAAGGAC GACAAGAAGC T G G C CCT GAACAAGC T GAGC CT GAACC T CT AC GAGAAC 308 8 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
3001 GT C TAC AAGGAC GACAAGAAG CT G GC C C T GAACAAGC T GAGC CT GAACCT C T AC GAGAAC 3 060 

3089 CAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTG 314 8 

I I I I II I II I I I I I II I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I I I I I I I I I I 
3061 CAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTG 3120 

3149 ACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACG 3208 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 ACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACG 3180 
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Qy 
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Db 


3781 


Qy 


3869 


Db 
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o y y 


Db 


3901 


Qy 
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GAGAT GGAT GAGAT C C GCAAGAAC C T GGG C AT GT G C C C G C AG C AC AAT GTGCTCTTT GAC 3268 
M | I I I I M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I 
GAGAT G GAT GAGAT C C G C AAGAAC C T GG G CAT GT G C C C G CAG C ACAAT GTGCTCTTT GAC 324 0 

CGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAG 332 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
CGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAG 3300 

GAGAT CC GC AGAGAGAT G GACAAGAT GAT C GAGGAC CT G GAGC T C T C CAAC AAAC G GC AC 3388 
I I I I I I I M I I II I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I II I I I 
GAGAT C C G C AGAGAGAT G GACAAGAT GAT C GAGGAC CT G GAGCT CT C C AACAAAC G GC AC 3360 

TCACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTC 344 8 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTC 3420 

GTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCG 3508 

I | | | | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I II U I I I I I I II 
GTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCG 34 8 0 

CGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCC 3568 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I I I I I I I II I I I 
CGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCC 3540 

ACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGG 3628 

I I | I I I M I I I I II I I II I It I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AC C C AC C AC AT G GAT GAGG CT GAC CT GC T T GG GGAC C GC AT T GCC AT CAT C T C C CAT GGG 3600 

AAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGC 368 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGC 3660 

CTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCC 3748 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II M I 

CTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCC 3720 

AGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATC 38 0 8 

I I I I I I I I I M I I 1 I I I I I I I I I I I I I It I I I I I I I II I I I II I I I I I I I I I I I I I I I I I 
AGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATC 37 80 

CGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATC 3868 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I It I I I I I I I I I I I I I I I I 
CGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATC 38 4 0 

CTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGC 392 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGC 3900 

AGC C T GGAT GC ACT G C AC C T CAG C AGC T T C GG GC T GAT G GAC AC GAC C CT G GAGGAAGT G 3988 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I 

AGCCTGGATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTG 3960 

TT C CT CAAGGT GT CGGAGGAGGAT CAGT CGCT GGAGAACAGT GAGGCCGAT GT GAAGGAG 4 04 8 
I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
T T C CT C AAG GT GT C GGAG GAG GAT CAGT C G C T G G AG AAC AGT GAG GCC GAT GT GAAG GAG 4020 



Qy 


4049 


Db 


4021 


Qy 


4109 


Db 


4081 


Qy 


4169 


Db 


4141 


Qy 


4229 


Db 


4201 


Qy 


4289 


Db 


4261 


Qy 


4349 


Db 


4321 


Qy 


4409 


Db 


4381 


Qy 


4469 


Db 


4441 


Qy 


4529 


Db 


4501 


Qy 


4589 


Db 


4561 


Qy 
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Db 


4621 


Qy 


4709 


Db 


4681 


Qy 
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Db 
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Qy 
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Db 
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Qy 


4889 



TCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGC 4108 

I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGC 408 0 

AATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCT 4168 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

AATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCT 4140 

GTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGC 4228 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGC 42 0 0 

CCCCTCTTT GAT AAC C C AC AGGAC C C AGAC AAT GT C AGC CT G C AAGAG GT G GAG G C AG AG 428 8 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

CCCCTCTTT GAT AACC CAC AG GAC C C AGACAAT GT CAG C CT GCAAGAG GT GGAG GCAG AG 4260 

GCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGC 434 8 
I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGC 432 0 

CAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTC 44 08 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I 

CAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTC 4380 

TTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCC 44 68 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCC 444 0 

GTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTAC 452 8 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTAC 4500 

ACCCAGCCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTG 4588 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
ACCCAGCCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTG 4560 

CGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGG 464 8 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGG 4620 

GTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAAC 4708 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAAC 4 68 0 

CTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAG 4768 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I II I I I I I I I I M I I I II I 

CTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAG 4740 

TCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCA 4828 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCA 4 800 

TCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCC 48 88 

I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I M M I I I I I I 
TCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCC 48 60 

ACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCC 4 94 8 



1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 4 8 61 ACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCC 4 92 0 

Qy 4 94 9 GTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGG 5008 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 GTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGG 4 98 0 

Qy 5009 CAC C C GC C C CAGAT GC G GGT G GT C AC AGGC G AC AT C C T GAC C GAC AT C AC C G GC C AC AAT 5068 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 4981 CAC C C G C C C CAGAT GCGGGTGGT CAC AG G C GAC AT C C T GAC C GAC AT CAC C G G C CAC AAT 504 0 

Qy 5069 GTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATC 5128 

I I I I I I I I I I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5041 GTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATC 5100 

Qy 5129 ACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATG 5188 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I t I I I I I I I I I I I I I I 
Db 5101 ACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATG 5160 

Qy 518 9 GTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACT^ACAACAAGGGCTATCAC 524 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 5161 GTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCAC 522 0 

Qy 5249 AGC AT GC C CAC C T AC CT C AAC AGC C T C AAC AAC GC CAT CCTGCGTGC C AAC CT G C C C AAG 5308 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 AGCATGCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAG 5280 

Qy 53 09 AGCAAGG GCAAC C CGGC GGCTT AC GG CAT CAC C GT CAC CAAC CAC C C CAT GAATAAG AC C 5368 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52 81 AGCAAGG GCAAC C C GG C G G CT T AC GG CAT CAC C GT CAC CAAC CAC C C CAT GAATAAG AC C 5340 

Qy 5369 AGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTC 5428 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5341 AGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTC 5400 

Qy 542 9 ATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAG 54 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 ATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAG 5460 

Qy 5489 TCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTG 5548 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 54 61 T C CAC CAAG GC CAAGCAT CT GC AGTT T GT C AGC GGCT GCAAC CC CAT CAT CT ACT GGCT G 5520 

Qy 554 9 GCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATC 5608 

I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I 
Db 5521 GCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATC 5580 

Qy 5609 CTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCC 5668 

I I 1 I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 5581 CTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCC 5640 

Qy 5669 CTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTC 5728 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 
Db 5641 CTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTC 5700 

Qy 5729 GAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACC 57 88 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 5701 GAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACC 5760 



Qy 5789 GCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTC 5848 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I | | | | | I I I I I 
Db 57 61 GCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTC 582 0 

Qy 584 9 AACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTC 5908 

I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 5821 AACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTC 5880 

Qy 5909 AT G GAGAT G G C C T AC AAC GAGT AC AT C AAC GAGT AC T AC G C C AAG AT T G G C C AGT T T G AC 5968 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 58 81 AT GGAGATGGC CTACAAC GAGTACAT CAAC GAGTACT AC GCCAAGATT GGCCAGTTT GAC 5940 

Qy 5969 AAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTT 6028 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I 
Db 5941 AAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTT 6000 

Qy 6029 GAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCA 6088 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I 
Db 6001 GAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCA 6060 

Qy 6089 CAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGG 6148 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II I I I I I I I I I I I I I I I I I 
Db 6061 CAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGG 612 0 

Qy 6149 C AG C GAGT G C T C C GG GGAGAC G C C GACAAT GAC AT GGT C AAGATT GAGAAC CT GAC CAAG 6208 

I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6121 C AG CGAGT GCTCCGGG GAGAC G C C GACAAT GACAT GGT CAAGATT GAGAAC C T GAC CAAG 6180 

Qy 62 09 GTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTG 6268 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 6181 GTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTG 624 0 

Qy 62 69 CGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTC 6328 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 6241 CGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTC 6300 

Qy 6329 AAGAT GCT GAC CG GC GAC GAGAGC AC GAC G GG GGGC GAGGC CT T C GT CAAT GGAC AC AG C 638 8 

I I I I I I I I I II I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 6301 AAGAT GCT GAC C G G C GAC G AGAG C AC GAC G G G G G G C GAG GCCTTCGT CAAT G GAC AC AG C 6360 

Qy 6389 GTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCG 644 8 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 63 61 GTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCG 642 0 

Qy 64 4 9 CTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATC 6508 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6421 CTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATC 648 0 

Qy 6509 TCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAG 6568 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 64 81 TCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAG 654 0 

Qy 65 69 TACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCC 6628 

I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 6541 TACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCC 6600 



Qy 6629 ATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGAC 668 8 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 1 I I I I 
Db 6601 AT C GC C CT CAT T G GGT AC C C AGC C T T CAT CT T CCT GGAC GAGC C C AC C AC AG GC AT G GAC 6660 

Qy 6689 CCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCA 674 8 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I 
Db 6661 CCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCA 6720 

Qy 6749 GTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATC 6808 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 6721 GTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATC 67 80 

Qy 6809 ATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGA 6868 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 6781 ATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGA 6840 

Qy 68 69 GAT GGCTACAT GAT CACGGTGC GGAC CAAGAGCAGCCAGAGT GT GAAGGACGT GGT GC GG 692 8 

I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I 

Db 6841 GAT GG CT ACAT GAT CAC GGT GC G GAC CAAGAGCAGCCAGAGT GT GAAGGAC GT G GT GC G G 6900 

Qy 6929 TTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACT^AAGGTGCAG 6988 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6901 TTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAG 6960 

Qy 698 9 T AC C AG CT C AAGT C GGAG CAC AT CTCGCTGGCC C AGGT GT T C AG C AAGAT GGAGC AGGT G 704 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6961 T AC CAG CT CAAGT C GGAG CAC AT CT C G CT GG C CCAGGT GT T C AG CAAGAT GGAG C AGGT G 702 0 

Qy 7 049 TCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTC 7108 

I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I I I I I 
Db 7 021 TCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTC 708 0 

Qy 7109 GTGAACTTT GCCAAGAAGCAGAGT GACAAC CT GGAGCAGCAGGAGAC GGAGCCGC CAT CC 7168 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7081 GT GAACTTT GCCAAGAAGCAGAGT GACAACCT GGAGCAGCAGGAGAC GGAGCCGCCAT CC 714 0 

Qy 7169 GCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACG 7228 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7141 GCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACG 7200 

Qy 7229 GAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTC 7288 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7201 GAGCT C C GG G CACT T GT G GCAGAC GAG C C C GAGGACCT GGAC AC G GAG GAC G AGGGC CT C 7260 

Qy 7289 ATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCA 734 8 

I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7261 ATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCA 7320 

Qy 734 9 C C C AGAGC T G G GC C AG GGAGGACACG C T C CACT GAC CAC C CAGAGCT GGG C C AGG GAC T C 74 08 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 7321 C C CAGAGCT GGGC CAGG GAG GAC ACG CT C CAC T GACC AC C CAGAGCT G GG C C AGG GAC T C 738 0 

Qy 7409 AACAAT GGGGACAGAAGT CC C CC AGT GC CT GC CAGGGC CT GGAGT GGAGGT T CAGGAC CA 7468 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7381 AACAAT GGGGACAGAAGT CCCCCAGTGCCTGCCAGGGCCT GGAGT GGAGGT T CAGGAC CA 744 0 



Qy 74 69 AGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCT 7510 

I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 7441 AGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCT 7482 
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ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 94 

I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I 
ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 60 

AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 
I I I M | M I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 12 0 

G GGCT GCGAC AGAAGAAG C C C AC CAT C T C CGT GAAGGAAGT C CC C TT CT AC ACAG C GG C G 214 

I I I M I I I I I I I I 1 I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCG 180 

CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II 
CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 240 

GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I I I 
GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 300 

GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 394 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I M I I I I I M I I I I I I I I I M I 
GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 360 
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395 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 454 



I I I I I I I I I I I II I M II I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 361 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 42 0 

Qy 455 C AC CT G GAC AGAT C C AC AGT GTCTTCCTTCTCTCT GGAC T C G GT G G C C AGAAAC C C GC AG 514 

II I I II II I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 C AC CT G GAC AGAT C C AC AGT GTCTTCCTTCTCTCT GGAC TCGGTGGC C AGAAAC C C GC AG 48 0 

Qy 515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I 
Db 4 81 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 54 0 

Qy 575 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 600 

Qy 635 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 601 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 660 

Qy 695 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 72 0 

Qy 755 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 814 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 78 0 

Qy 815 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 874 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 84 0 

Qy 875 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 934 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 900 

Qy 935 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 994 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 901 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 960 

Qy 995 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 102 0 

Qy 1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1021 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 108 0 

Qy 1115 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1140 

Qy 1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I I I I I I I I I I 

Db 1141 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 12 00 

Qy 1235 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 12 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 



Db 12 01 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1260 

Qy 12 95 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

I | | | | M I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 1261 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 132 0 

Qy 1355 AGC AAG GAGC AG C G GAAC CTGGGCCTCCTC GT GCAC CT CAT GAC CAG CAAC CC CAAAAT C 1414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 1321 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 1380 

Qy 1415 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1474 

I M | I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1381 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 144 0 

Qy 14 75 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 

Db 1441 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1500 

Qy 1535 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1501 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1560 

Qy 1595 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1561 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1620 

Qy 1655 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1680 

Qy 1715 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 1774 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 AT T GACAACGG GGC C T G C GG CT GGAT C C AGT T CAT GT C CAAG GT GAG CGT GGACAT CT T C 174 0 

Qy 1775 AAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGAC 1834 

I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 AAGGG CTT CC C C GAC GAGGAGAGCAT T GT CAACT AC AC C CT CAAC CAG G C C T AC C AGGAC 1800 

Qy 1835 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I t I I I I 

Db 18 01 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 60 

Qy 1895 C AC GT G C AC T AC AAG AT C C G C C AG AAC T C CAG CTT C AC C G AG AAAAC CAAC GAG AT C C G C 1954 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I 

Db 1861 CACGT GCACTACAAGAT CC GCCAGAACT CCAGCTT CAC C GAGAAAACCAAC GAGAT CCGC 1920 

Qy 1955 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2014 

I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 

Db 1921 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 1980 

Qy 2015 GTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTG 2074 

I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 1981 GT C T G GAT C CAG GAC AT GAT G GAG C G C G C CAT CAT C GAC AC TTTTGTGGGG CAC GAC GT G 2040 

Qy 2075 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2134 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II II I I I I I I II I I I I 

Db 2 041 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2100 



Qy 2135 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2194 

I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2160 

Qy 2195 GCCAT GAC CAT CCAGCACAT C GT GGCGGAGAAGGAGCAC CGGCTCAAGGAGGT GAT GAAG 2254 

I I I I I I I II I I I II I I I II I I I I I I i II I I I I I I I I I I I I II I I I I I I I I I I I II II I I I 
Db 2161 GCCAT GAC CAT CCAGCACAT C GT GGCGGAGAAGGAGCAC CGGCTCAAGGAGGT GAT GAAG 2220 

Qy 2255 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 2221 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2280 

Qy 2315 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2374 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 2281 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATACAC 2340 

Qy 2375 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2434 

I I I M II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2400 

Qy 2435 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2494 

I I I I I I I I I I I M I II I I I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I 

Db • 2401 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2460 

Qy 2495 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 2554 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 2520 

Qy 2555 GAT AAGAT C AC GGC CT T C GAGAAGT GC AT CGCGTCCCT C AT GT CC AC GAC GG C CT T T GGT 2614 

I II I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2521 GAT AAGAT C AC GGC CT T C GAGAAGT GC AT CGCGTCCCT C AT GT C C AC GAC GGC CT T T GGT 258 0 

Qy 2 615 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2674 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 

Db 2581 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2640 

Qy 2 675 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2734 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2700 

Qy 2735 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 27 94 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2760 

Qy 2795 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2854 

I I I II I I I II I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 27 61 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 282 0 

Qy 2855 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2914 

I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2821 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2880 

Qy 2915 AT GGAGGAG GACCAGGC CT GT G CC AT G GAGAG CC GG C G C T TT GAGGAGAC C C GT GG CAT G 2974 

II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I 

Db 2 881 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 2940 



Qy 2975 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3034 

I I I II I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I 
Db 2941 GAGGAG GAGCC CAC C C AC CT G C CT CT G GT T GT CT GC GT GGACAAACT CAC C AAG GT C T AC 3000 

Qy 3035 AAG G AC G AC AAG AAG CTGGCCCT G AAC AAG C T GAG C C T G AAC C T C T AC G AG AAC C AG G T G 3094 

I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3001 AAG GAC GACAAGAAG C T GG C C CT GAAC AAG C T GAGC CT GAAC CT CT AC GAGAAC CAG GT G 30 60 

Qy 3095 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 3154 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3061 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 312 0 

Qy 3155 CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 3214 

I M I I I I 11 II I I I I I I I I I ! I I I I I I I I I I M I I I I I I I I M I I I I I I I I I I I I I I II I 

Db 3121 C T GT T CC CT C C AAC GT C GGGT T CC G C CAC CAT CT AC GG GCAC GAC AT C C GCAC GGAGAT G 318 0 

Qy 3215 GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 3274 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I 
Db 3181 GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 324 0 

Qy 3275 AC G GT G GAG GAACACCT CT GGT T C T AC T CAC G GCT CAAGAG CAT GGCT C AGGAGGAGAT C 3334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I 1 I II I I I I I I I I I I I I 1 I I i I 1 I I 
Db 3241 ACGGT GGAGGAACAC CT CT GGT TCT ACT CAC GGCT CAAGAGCAT GGCT C AGGAGGAGAT C 3300 

Qy 3335 CGCAGAGAGAT GGACAAGAT GATCGAGGACCTGGAGCTCTCCAACAAACGGCACTCACT G 3394 

I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 
Db 3301 C G CAGAGAGAT GGACAAGAT GAT C GAGGAC CT GGAGCT C T C CAACAAAC G GC ACT C ACT G 3360 

Qy 3395 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 3454 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 342 0 

Qy 3455 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 3514 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 3480 

Qy 3515 G C CAT C T GG GAC CT CAT CCT GAAGT ACAAGC CAGGC C GCAC C AT CCT T CT GT C C ACC C AC 3574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I 11 I I 
Db 3481 G C CAT CT GGGAC CT CAT CCT GAAGT ACAAGC CAGGC C GCAC CAT C CT T CT GT C CAC C CAC 3540 

Qy 3575 CACAT GGAT GAGGCT GACCT GCTT GGGGACCGCATT GCCAT CAT CTCCCAT GGGAAGCT C 3634 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3541 CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTC 3600 

Qy 3635 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3694 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3601 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3660 

Qy 3695 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 3754 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

Db 3661 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 3720 

Qy 3755 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 3814 

I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I 

Db 3721 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 37 8 0 

Qy 3815 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 3874 



I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3781 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 3840 

Qy 3875 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I 
Db 3841 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3900 

Qy 3935 GAT G C ACT GC AC CT C AGC AG CT T C G G G CT GAT G GAC AC G AC C C T GGAG G AAGT GT T C C T C 3994 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I | I I 
Db 3901 GAT GCACT GC AC C T C AG CAG CT T C GG GCT GAT GGACAC GAC C C T G GAGGAAGT GT T C C T C 3960 

Qy 3995 AAGGT GT C G GAGGAG GAT C AGT C G CT GGAGAACAGT GAGG C C GAT GT GAAG GAGT C C AGG 4054 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 39 61 AAG GT GT C G GAG GAGGAT C AGT C G CT GGAGAACAGT GAG G C C GAT GT GAAGGAGT C CAG G 4 02 0 

Qy 4 055 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 021 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4 080 

Qy 4115 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 4174 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II 
Db 4 081 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 414 0 

Qy 4175 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 4141 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4200 

Qy 4235 T T T G AT AAC C C AC AG GAC C C AG AC AAT GT CAG C C T G C AAG AG G T G GAG G CAG AG G C C C T G 42 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I 

Db 42 01 T TT GAT AAC C CAC AGGAC C C AGACAAT GT CAG C CT G CAAGAGGT GGAGGC AGAG GC C C T G 42 60 

Qy 4295 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4261 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 432 0 

Qy 4355 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 321 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4380 

Qy 4415 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4 47 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 4381 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4 44 0 

Qy 4475 GAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAG 4534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4441 GAGAT T G GT GAT CTGCCCCCGCTGGTCCTGT CAC CT T C C CAGT AC C ACAAC T ACAC C CAG 4500 

Qy 4535 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4 560 

Qy 4595 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 45 61 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 462 0 

Qy 4 655 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4 714 

I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



4 621 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4 68 0 

4715 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 477 4 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I 

4 681 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 474 0 

4775 ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4 834 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I I I I I 

4741 ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4 8 00 

4835 TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 4 8 94 

I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4801 TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 48 60 

4 895 GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4954 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I 

4 861 GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 492 0 

4955 TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 5014 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

4921 TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 4 98 0 

5015 C CCCAGAT GC GGGT GGT CACAGGCGACAT CCT GAC C GACATCACCGGC CACAATGT CT CT 507 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 981 C C C CAGAT GC GG GT GGT C AC AGG C GACAT CCT GAC C GAC AT C AC C GGC CACAAT GT CT C T 5040 

5075 GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5134 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

5041 GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5100 

5135 GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5194 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

5101 GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5160 

5195 AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 5254 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

5161 AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 522 0 

5255 CCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAG 5314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I 

5221 C C CAC CTAC CT CAAC AG CCT CAACAAC GC C AT CC T GC GT GCCAAC CT G C C CAAGAG CAAG 52 80 



5315 



5281 



5375 



G G CAAC CCGGCGGCT T AC G G CAT CAC C GT CAC CAAC CAC C C CAT G AAT AAG AC C AG C G C C 537 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I I I 

G GCAAC CCGGCGGCT T AC GGC AT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC CAG C GC C 534 0 



AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 5434 

I I I I II I I I M I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5341 AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 54 00 
5435 GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 54 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

5401 GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 54 60 



5495 



5554 



AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
54 61 AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 5520 



Qy 5555 TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 5614 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5521 TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 55 8 0 

Qy 5615 GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 5674 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 5581 GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 5640 

Qy 5675 CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 5734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 5 641 CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 5700 

Qy 5735 CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 5794 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 5701 CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 5760 

Qy 5795 GTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGT 5854 

I I I I II I I I I I I I I II I II II II I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
Db 5761 GT G GC CAC CTT CC T G CT AC AGC T CT T C GAG C AC GACAAG GAC CT GAAG GT T GT CAAC AGT 582 0 

Qy 58 55 TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 5914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5821 TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 588 0 

Qy 5915 AT GGCCTACAACGAGT ACAT CAACGAGTACT ACGCCAAGATT GGCCAGTT TGACAAGAT G 5974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5881 AT GGCCTACAACGAGT ACAT CAAC GAGTACT AC GC CAAGATT GGCCAGTTT GACAAGAT G 5940 

Qy 5975 AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 6034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5941 AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 6000 

Qy 6035 GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 6094 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I 

Db 6001 GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 6060 

Qy 6095 ATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGA 6154 

1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 6061 ATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGA 6120 

Qy 6155 GTGCTCCGGG GAG AC G C C G AC AAT GAC AT G GT C AAG AT T G AG AAC C T GAC C AAG GT C T AC 6214 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 

Db 6121 GT G CT C C G GGGAGAC GC C GACAAT GAC AT GGT CAAGAT T GAGAAC CT GAC CAAGGT CT AC 6180 

Qy 6215 AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 6274 

I II I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

Db 6181 AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 6240 

Qy 6275 GGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATG 6334 

I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6241 GGCGAGTGCTTCGGGCTCCTGGGCGT CAAC GGT GCGGGCAAGACCAGCACCTT CAAGAT G 6300 

Qy 6335 CT GAC C G GC GAC GAG AG CAC GAC G GG G G GC GAG G C CT T C GT C AAT GGAC AC AG C GT GCT G 6394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6301 CTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTG 6360 



Qy 6395 AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 6454 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | I II I I I I I I I I I I I I | | | | | | | | | M I I I 
Db 6361 AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 642 0 

Qy 6455 GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 6514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I 
Db 6421 GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 648 0 

Qy 6515 AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 6574 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6481 AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 654 0 

Qy 6575 GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 6541 GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6600 

Qy 6635 CTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAG 6694 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6601 C T CAT T G G G T AC C C AG C C T T CAT C T T C C T G G AC GAG C C C AC C A C AG G CAT G G AC C C C AAG 6660 

Qy 6695 GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 6754 

I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | 
Db 6661 GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 672 0 

Qy 6755 CTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTG 6814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 6721 CTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTG 678 0 

Qy 6815 AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 6874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 67 81 AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 684 0 

Qy 6875 T ACAT GAT CAC GGT GC GGAC CAAGAGC AG C C AGAGT GT GAAGGAC GT G GT GCGGT T CT T C 6934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6841 T ACAT GAT CAC GGT GC GGAC CAAGAG CAG C C AGAGT GT GAAG GAC GT GGT GCGGTTCTTC 6900 

Qy 6935 AAC C G C AACT T C C C G GAAGC CAT G CT CAAG GAGC G GCAC CACACAAAG GT GCAGT AC CAG 6994 

I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 6901 AACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAG 6960 

Qy 6995 CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 7054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6961 CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 7 02 0 

Qy 7055 GTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTCGTGAAC 7114 

I I I I M I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7021 GT GCT GGGCAT CGAGGACTACT C GGT CAGC CAGAC CACACTGGACAAT GT GTT CGT GAAC 708 0 

Qy 7115 T T T G C CAAG AAG CAG AG T GAC AAC C T G GAG CAG CAG GAG AC G GAG C C G C CAT C C G CAC T G 7174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7081 T T T G C CAAGAAG C AGAGT GACAAC CT G GAGC AG CAG GAGACGGAGC C GC CAT C C GC ACT G 7140 

Qy 7175 CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 7234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7141 CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 72 00 

Qy 7235 C GG GCACT T GT GG CAG AC GAGC C C GAG GAC CT GGACAC G GAGGAC GAGGG C CT C AT CAG C 72 94 



Db 72 01 CGGGCACTT GT GGCAGAC GAGC CC GAGGACCT GGACAC GGAGGAC GAGGGC CT CAT CAGC 7260 

Qy 7295 TTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTC 7339 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 7261 T T C GAGGAGGAG C GG GC C C AG CT GT C CT T CAAC AC G GAC AC GCT C 7305 
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AX088337 6792 bp DNA linear PAT 17-MAR-2001 

Sequence 1 from Patent WO0114414. 

AX088337 

AX088337 .1 GI : 13397233 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

le Bihan,S., Wilson, C. and Charest,D.L. 
Human abc2 transporter and uses thereof 
Patent: WO 0114414-A 1 01-MAR-2001; 
Activepass Pharmaceuticals , Inc. (CA) 

Location/Qualifiers 

1. .6792 

/organism= lf Homo sapiens" 
/mol_type="unas signed DNA" 
/db_xref="taxon: 9606" 
91. .6096 

/note="unnamed protein product" 

/codon_start=l 

/protein_id="CAC34694 . 1" 

/db_xref="GI: 13397234" 

/ db_x r e f = " REMT REMBL : CAC 34694" 

/translation="MSSLGFTSKEQRNLGLLVHLMTSNPKILYXPAGSEVDRVILKAN 
ETFAFVGNVTHYAQVWLNISAEIRSXLEQGRLQQHLRWLQQYVAELRPHPEALNLSLD 
ELPPALRQDNFSLPSGMALLQQLDTIDNAPCGWIQFMSKVSVDIFKGFPDEESIVNYT 
LNQAYQDNVTVFAGVI FQTRKDGSLP PHVHYKI RQNS S FTEKTNEI RRAYWRPGPNTG 
GRFYFLYGFVWIQDMMERAIIDTFVGHDWEPGSYVQMFPYPCYTRDDFLFVIEHMMP 
LCMXISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTA 
LTAILKYGQVLMHSHWIIWLFLAVYAVATIMFCFLVSVLYSKAKLASAGGIIYFLSY 
VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQS 
PVEGDDFNLLLAVTMLMVDAWYGILXWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGR 
TEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLWXVDKLTKVY 
KDDKKLALNKLSLNLYENQGVSFLGHNGAGKTTTMSILTGLFPPTSGSATIYGHDIRT 
EMDEIRKNGHVPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIPREMDKMIEDLELSNKR 
HSLVQTLSGGMKRKVSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTI 
LLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQE 
PGLASSPPGRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFER 
LFQHLERSLDALHLSSFGLMDTTLEEVFLKVSGGDQSLENSGADVKESRKDVLPGAEG 
HASGEGHAGNLARCSELTQSQASLQSASSVGSALGDEGAGYTDVYGDYPPLFDNPQDP 
DNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQILLP 
AFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLSPD 
ASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFT 
QGL P L S N FVP P P P S PAP S D S PAS P DED LQAWN VS L P PT AGQ EMWT SAP S L P RLVRE P V 
RCTCSAQGTGFSCPNSVGGHPPQMRWTGDILTDITGHNVSEYLLFTSDRFRLHRYGA 



IT FGNVLKS I PAS FGTRAP PMVRKI RCARAAQVF YNNKG YH SMPT YLN S LNNAI LRAN 
LP KS KGN PAAYGI TVTNH PMNKT S AS L S LD YL LQGT DWI AI FI I VAMS FVPAS FWF 
LVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPT 
NFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYXFLIVINLFIGITATVATFLLQLF 
EHDKDLKWNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWD 
IVTRGLVAMAVEGWGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQRVLRGD 
ADNDMVKIENLTKVYKSRKIGRILAVDRLCLGVRPGECFGXLGVNGAGKTSTFKMLTG 
DESTTGGEAFVNGHSVLKELXQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGIXWK 
DEARWKWALEKLELTKYADKPAGTYSGGNKRKLSTAI7VLIGYPAFIFLDEPTTGMDP 
KARRFLWNLILDLIKTGRSWLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRF 
GDGYMITVRTKSSQSVKDWRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKM 
EQVS GVLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRP 
RSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC" 

ORIGIN 

Query Match 83.2%; Score 6686.8; DB 6; Length 6792; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 6748; Conservative 9; Mismatches 33; Indels 7; Gaps 4; 



1244 TCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACC 1303 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I M I I I I I 

1 TCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACC 60 
1304 ATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAG 1363 



I I I I I I I I I I I 1 I I I I I I I I I 1 I I I I I I ! I I I I I I I I I I I I I I M I I I I 1 I I I I I I I I I I 

Db 61 ATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAG 120 

Qy 1364 CAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCG 1423 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I II : I 

Db 121 CAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGSG 18 0 

Qy 1424 CCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTG 14 8 3 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I II 
Db 181 CCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTG 24 0 

Qy 1484 GGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTC 1543 

I | | I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I M I : I 
Db 241 GGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTYC 300 

Qy 1544 CTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTG 1603 

| | | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I 
Db 301 CT GGAGCAGGGCAGGCT GCAGCAACACCT GC GCT GGCT GCAGCAGT AT GT AGC AGAGCT G 360 

Qy 1604 CGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAG 1663 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 361 CGGCCGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAG 420 

Qy 1664 GAC AACTT CT C GCT GCC CAGT G GC AT G GC C CT CC T GCAGC AGCT G GAT AC CAT T GACAAC 1723 

| || I I I I I I I I I I I I II I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 421 GACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTACAGCAGCTGGATACCATTGACAAC 480 



1724 GCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTC 1783 
III I I I I I I I II II I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I 
481 GCGCCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTC 540 



1784 C CC GAC GAG GAGAGC AT T GT CAACT AC AC C CT CAAC C AG G C CT AC C AG GACAAC GT C ACT 1843 
I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 



541 C C C GAC GAG GAGAG CAT T GT CAAC T ACAC C C T CAAC CAG GC CT AC C AG GACAAC GT C ACT 600 

1844 GTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCAC 1903 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
601 GTTTTTGCCGGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCAC 660 

1904 T AC AAG AT C C G C C AGAAC T C CAG C T T C AC C G AG AAAAC CAAC GAG AT CCGCCGCGC C T AC 1963 
I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 T AC AAG AT C C G C CAG AAC T C CAG C T T C AC C GAG AAAAC CAAC GAG AT CCGCCGCGCC T AC 72 0 

1964 TGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATC 2023 

I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 TGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATC 78 0 

2 02 4 CAG GAC AT GAT G GAG C G C G C CAT CAT C GAC AC TTTTGTGGGG C AC GAC G T G GT G G AGC C A 2083 
I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
781 CAG GAC AT GAT G GAGC G C GC CAT CAT C GAC ACTT TT GT G G GGC AC GAC GT GGT GGAG C CA 840 

2084 GGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTC 2143 
I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
841 GGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTC 900 

2144 ATT GAGC AC AT GAT GC C GCT GT GCAT GGT GAT CT CCT GGGT CTACTCC GT GGCCAT GACC 2203 
I I I I II I I I I I I I I I I I I I I I I I I I I I I : I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
901 ATTGAGCACATGATGCCGCTGTGCATGGYGATCTCCTGGGTCTACTCCGTGGCCATGACC 960 

2204 AT C CAGC AC AT C GT GG C GGAGAAG GAGC AC C GG CT CAAG GAGGT GAT GAAGAC CAT GG GC 2263 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 AT C CAGC AC AT C GT GGC GGAGAAG GAGC AC C G G C T CAAG GAGGT GAT GAAGAC CAT GG GC 102 0 

2264 CTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATC 2323 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1021 CTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATC 108 0 

2324 TCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTG 2383 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1081 TCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTG 1140 

2384 GTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTG 244 3 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 
1141 GTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTG 12 00 

2444 GTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTC 2503 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1201 GTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGC T GGT GGCAT CAT CT ACTT C 1257 

2504 CT GAGCT AC GT G CC C T ACAT GT AC GT G G C GAT C C GAGAGGAGGT GGC G CAT GATAAGAT C 2563 

I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1258 CT GAGCT AC GT G CC CT ACAT GT AC GT G G C GAT C C GAGAGGAGGT GG C G CAT GATAAGAT C 1317 

2564 ACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCT 262 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I 
1318 ACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCT 137 7 

2624 AAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAG 268 3 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I II I 

1378 AAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAG 1437 
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2 684 TCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGAC 2743 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
1438 TCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGAC 1497 

2 7 44 GCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGG 2 803 

I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
1498 GCCGTGGTCTATGGCATCCTCMCGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGG 1557 

2804 CTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACA 2863 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1558 CTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACA 1617 

2864 GAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAG 2923 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1618 GAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAG 1677 

2924 GAG CAGGC CT GT G C CAT G GAGAGC CG GC GCTT T GAG GAGAC CC GT GG CAT GGAGGAG GAG 2 983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

1678 GAC C AGGC CT GT GC CAT G GAGAGC CGGCGCTTT GAGGAGAC C C GT G G C AT GGAG GAGGAG 1737 

2984 CCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGAC 3043 

I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1738 CCCACCCACCTGCCTCTGGTTGTCTKCGTGGACAAACTCACCAAGGTCTACAAGGACGAC 1797 

3044 AAGAAGCT G GC C CT GAAC AAGCT GAG CCT GAAC CT CT AC GAGAAC CAGGT GGT CT C C T T C 3103 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1798 AAGAAGCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGGGGTCTCCTTC 1857 

3104 TTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCT 3163 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 
1858 TTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGT.TCCCT 1917 

3164 CCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATC 3223 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
1918 C CAAC GTCGGGTTC C GC CAC CAT CT ACGG G C AC GACAT C C GCACGGAG AT GGAT GAGAT C 1977 

3224 CGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAG 3283 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1978 CGCAAGAAC — GGGCATGTGCCC-CAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAG 2034 

3284 GAACACCT CT GGTT CTACT CACGGCT CAAGAGCAT GGCT CAGGAGGAGAT C C GCAGAGAG 3343 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2035 GAAC AC CT CT G GT T CTACT CAC GGCT CAAGAG CAT GGCT CAG GAG GAGAT C C C CAGAGAG 2094 

3344 AT G G AC AAG AT GAT C GAG GAC C T G GAG C T C T C C AAC AAAC G G CAC T CAC T G GT G CAG AC A 3403 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
2095 AT G G AC AAGAT GAT C GAG GAC C T G GAG C T CT C CAAC AAAC G G CAC T CAC T G GT GC AG AC A 2154 

3404 TTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGC 3463 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2155 TTGTCGGGTGGCATGAAGCGCAAGGTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGC 2214 

34 64 GCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGG 352 3 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I 
2215 GCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGG 227 4 



Qy 3524 GAC CT CAT C C T GAAGT AC AAG C C AG GC C GC AC CAT CCTTCTGTC C AC C CAC CACAT GGAT 3583 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I I II I I I I I I I I I I 

Db 2275 GAC C T CAT C C T GAAGT AC AAG C C AG G C C G CAC CAT CCTTCTGTC CAC C CAC CACAT G GAT 2334 

Qy 3584 GAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGC 3643 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 2335 GAG G CT GAC CT GC T T GGG GAC C GCAT T GC CAT CAT C T C C CAT G GGAAGC T CAAGT G C T GC 2394 

Qy 3644 GGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAG 3703 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2395 GGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAG 2454 

Qy 37 04 CGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGG 3763 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2455 CGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGG 2514 

Qy 37 64 GCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCC 3823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2515 GCCCCTCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCC 2574 

Qy 3824 T CCT GC CT GCT GGT CT CAGAC ACAAG CAC GGAG CT CT C C T AC AT C C T GC C CAG C GAGG C C 38 83 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2575 TCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCC 2 634 

Qy 38 84 GCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTG 3 943 

I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2635 GCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTG 2 694 

Qy 3944 CACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCG 4003 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 2695 CACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCG 2754 

Qy 4004 GAG GAG GAT C AGT C G C T G G AG AAC AGT GAG G C C GAT GT G AAG G AGT C CAG G AAG GAT G T G 4063 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2755 GG G GGGGAT C AGT C GCT G GAGAAC AGT G G GG CC GAT GT GAAGGAGT C C AGGAAGGAT GT G 2 814 

Qy 4 064 CTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGC 4123 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2815 CTCCCTGGGGCGGAGGGCCACGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGC 2874 

Qy 4124 TCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGT 4183 

I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 2 875 TCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCTG 2 934 

Qy 4184 GGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAAC 4243 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2935 GGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCCCCCCCTCTTTGATAAC 2994 

Qy 4244 CCACAGGACCCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTC 4303 

I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 

Db 2995 CCACAGGACCCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTC 3054 

Qy 4304 GGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTG 4363 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3055 GGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTG 3114 



Qy 



4364 CTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTG 4 423 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

3115 CTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTG 3174 

4424 CTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGT 4483 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3175 CTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGT 3234 

4484 GATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGC 4543 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I II I I I 
3235 GATCTTCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGC 32 94 

4544 AATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGAC 4603 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
3295 AATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGAC 3354 

4604 GCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGC 4663 

I I I I I I I I I I I II I I I II I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I II I I I I 
3355 GCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGC 3414 

4664 GTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAG 472 3 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I 
3415 GTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAG 3474 

4724 TCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGG 478 3 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3475 TCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGG 



3534 



4784 CTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCG 4843 

I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3535 CTGCCACTGTCAAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCG 3594 

4844 TCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAA 4 903 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
3595 TCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCAAGAA 3654 

4 904 ATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGC 4963 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3655 ATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGC 3714 

4964 TCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATG 5023 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
3715 TCTGCGCAGGGCACCGGCTTCTCCTGCCCCAACAGTGTGGGCGGGCACCCGCCCCAGATG 3774 

5024 C GG GT GGT C ACAGG C GAC AT C C T GAC C GACAT C AC C GGCC ACAAT GT CT C T GAGT AC C T G 5083 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II 
3775 CGGGT GGT C AC AGGC GAC AT C CT GAC C GACAT C AC C GGC C ACAAT GT C T C T GAGT AC CT G 3834 

5084 CTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTC 5143 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3835 CTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTC 38 94 

5144 CTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCG 52 03 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3895 CTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCCGG 3954 

5204 GTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTAC 5263 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
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Db 
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Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



3955 TGCGCCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTAC 4 014 

52 64 CTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCG 5323 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 

4015 CTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCG 4 074 



5324 



5383 



GC G GCT T AC G GCAT C AC C GT C AC C AACC AC C C CAT GAATAAGAC C AGC G C C AG C C T CT C C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 075 GCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCC 4134 

5384 CTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATG 5443 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4135 CT G GAT T AC CT GCT G CAG G G C AC G GAT GT C GT CAT C GC CAT CT T CAT CAT C GT GGC CAT G 4194 

5444 TCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAG 5503 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
4195 TCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAG 4254 

5504 CATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGG 5563 

II I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I M I 
CACCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGG 4 314 



4255 



5564 



4315 



GACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGAC 5 623 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGAC 4374 



5624 CTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTAT 5683 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4375 CTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTAT 4 434 

5684 GGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCC 5743 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4435 GGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCC 44 94 

5744 GCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACC 5803 

I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II II I I 
4495 GCCTACGKGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACC 4 554 

5804 T T C CT G C T AC AG CT CT T C GAG C AC GAC AAGGAC CT GAAGGT T GT C AAC AGT T AC C T G AAA 5863 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4555 TTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAA 4 614 

58 64 AGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTAC 5923 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
4615 AGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTAC 4674 

5924 AAC GAGTACAT CAAC GAG TACT ACGC CAAGATT GGCCAGTTT GACAAGATGAAGT CCC C G 5983 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
4675 AAC GAGTACAT CAAC GAG TACT AC GC CAAGAT T GG C C AGT T T G ACAAGAT GAAGT C C C C G 4734 

5984 TTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGC 6043 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4735 TTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGC 47 94 

6044 TTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTG 6103 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I II I I I I I 
4 7 95 TTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTG 4854 



Qy 6104 T C T AC CAAG C CT GT G GAGGAT GAT GT G G AC GT G GC CAGT GAG C GGCAG C GAGT G CT C C GG 6163 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 4855 TCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGGGTGCTCCGG 4914 

Qy 6164 G GAGACGC C GACAAT GACAT G GT CAAGAT T G AGAAC CT GAC CAAG GT C T ACAAGT C C C GG 6223 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 4915 GGAGACG C C GACAAT GACAT G GT CAAGAT T GAGAAC CT GAC CAAG GT C TACAAGT C C C GG 4974 

Qy 6224 AAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGC 62 83 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 4975 AAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGC 5034 

Qy 628 4 TTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGC 634 3 

I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5035 TTCGGGCYCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGC 5094 

Qy 634 4 GACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTG 64 03 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5095 GACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTG 5154 

Qy 6404 CTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTC 64 63 

I : I II I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5155 CHCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTC 5214 

Qy 64 64 ACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAG 6523 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I 
Db 5215 ACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTNCGTGGGATCYCCTGGAAGGACGAG 5274 

Qy 6524 GC CCGGGTGGT GAAGT G GG CT C T GGAGAAGC T G GAG CT GAC CAAGTAC GC AGACAAGC C G 6583 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5275 GCCCGGGTGGT GAAGT G GGCT C T GGAGAAGC T G GAG CT GAC CAAG T AC GC AGACAAGC C G 5334 

Qy 6584 GCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGG 6643 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 5335 GCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGG 5394 

Qy 6644 TACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGC 6703 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5395 TACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGC 5454 

Qy 6704 TTCCTCTG G AAC C T CAT C C T C GAC C T CAT CAAG AC AG G G C GT T C AG T G G T G C T GACAT C A 6763 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5455 T T C C T CT GGAAC CT CAT CCT T G AC CT CAT CAAGACAGGG C GTT C AGT G GT G CT GACAT CA 5514 

Qy 6764 C AC AG CAT GGAGGAGT GCGAG G CG CT GT G CACG C GG CT GGC CAT CAT G GT GAAC GGT C GC 6823 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5515 CACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGC 5574 

Qy 6824 CT G C GGT GC CT GGGCAGCAT C C AGCAC CT GAAGAAC C GGT T T G GAGAT GGC T ACAT GAT C 6883 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 5575 CTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATC 5634 

Qy 6884 ACGGTGCGGACCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAAC 6943 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5635 AC GGT GCGGACCAAGAGCAGCCAGAGT GTGAAGGACGT GGT GCGGTT CTTCAACCGCAAC 5694 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



6944 TT CC C GGAAGC CAT G CT C AAGGAG CG G C AC C AC ACAAAGGT GC AGT AC C AG CT CAAGT C G 7 003 

I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
5695 TTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCG 5754 

7 004 GAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGC 7 063 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
5755 GAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGC 5814 

7064 AT C GAG G AC T AC T C G G T C AG C C AGAC C AC AC T G G AC AAT GTGTTCGT G AAC T T T G C C AAG 7123 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
5815 AT C GAGGACT ACT C G GT C AGC CAGAC C AC AC T G GACAAT GT GT T C GT GAAC T T T G C C AAG 587 4 

7124 AAGCAGAGT GACAAC CT GGAGCAGCAGGAGACGGAGCC GCCAT CC GCACT GCAGT C CC CT 7183 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGCAGAGT GACAAC CTGGAGCAGCAGGAGACGGAGCCGCCATCC GCACT GCAGT CCCCT 



5875 



5934 



7184 CTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTT 7243 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I I I II I I I I 
5935 CTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTT 5 994 

7244 GT GGCAGAC GAG C C C GAGGAC CT GGACAC GGAG GAC GAG GGCCT CAT CAG CTT CG AGGAG 7303 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 

5995 GT GGCAGAC GAG C C C G AGGAC CT G GACAC GGAG GAC GAG GGCCT CAT CAG C T T C GAG GAG 6054 

7304 GAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCA 7363 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6055 GAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCA 6114 

7364 GGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGA 7423 

I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
6115 GGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGA 6174 

7424 AGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCC 74 83 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I II I I I I I I I I I I I I I I I I I I 
6175 AGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCC 6234 

7484 TCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCC 754 3 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
6235 TCCAGCCCCTGTACTCGGCCATG-CCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCC 62 93 

7544 AAAGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGG 7 603 

I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I II I I I I I I II I I I I I 
6294 AAAGGCTGACCCGGCCTGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGG 6353 

7 604 GTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGG 7 663 

I I I I I I I I I I I I I I I II I II I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

6354 GTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGG 6413 

7664 ACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGAT 7 723 

I I I I II I I I I I I I II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I 
6414 ACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGAT 6473 

7724 GAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGC 7783 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6474 GAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGC 6533 

7784 TTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAG 7 843 



I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

Db 6534 TTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAG 6593 

Qy 7 844 CCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGG 7903 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 
Db 6594 CCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGG 6653 

Qy 7 904 CAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCC 7963 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6654 CAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCC 6713 

Qy 7964 CTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAA 8023 

I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 6714 CTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAA 6773 

Qy 8024 T AAAT AAACAAAAT GT C 804 0 

II II I I I I I I I I I I I I I 

Db 6774 TAAAT AAACAAAAT GT C 6790 
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AB028985 6011 bp mRNA linear PRI 10-MAY-2002 

Homo sapiens mRNA for KIAA1062 protein, partial cds . 

AB028985 

AB02 8985.2 GI: 20521747 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 

Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 

1 

Kikuno,R., Nagase,T., Ishikawa,K., Hirosawa,M., Miyajima,N., 
Tanaka,A. , Kotani,H., Nomura, N. and Ohara,0. 

Prediction of the coding sequences of unidentified human genes. 

XIV. The complete sequences of 100 new cDNA clones from brain which 

code for large proteins in vitro 

DNA Res. 6 (3), 197-205 (1999) 

99397452 

10470851 

2 (bases 1 to 6011) 

Ohara,0., Nagase,T. and Kikuno,R. 

Direct Submission 

Submitted ( 17- JUN-1999 ) Osamu Ohara, Kazusa DNA Research Institute, 
Laboratory of DNA Technology; Yana 1532-3, Kisarazu, Chiba 
292-0812, Japan (E-mail : cdnainf o@kazusa . or . jp, Tel : +8 1-438-52-3913, 
Fax:+81-438-52-3914) 

On May 9, 2002 this sequence version replaced gi: 5689460. 
Location/ Qualifiers 
1. .6011 

/organism="Homo sapiens" 

/mol_type= ,, mRNA" 

/db_xref="taxon: 9606" 

/ chr omo s ome= " 9 " 

/clone="hj03579sl" 

/ tissue_type="brain n 

/clone_lib="pBluescriptII SK plus" 



/note="This sequence was obtained bysubcloning of the DNA 

fragments derived from two cDNA clones (1 - 2387 was 

derived from hg03338 and 2388 - 6011 was derived from 

hj03579)." 
gene 1. .6011 

/gene="KIAA1062" 
CDS <1. .5316 

/gene="KIAA1062" 

/ codon_start=l 

/product="KIAA1062 protein" 

/protein_id="BAA83014 .2" 

/db_xref="GI : 20521748" 

/translation="MMERAIIDTFVGHDWEPGSWQMFPYPCYTRDDFLFVIEHMMP 

L CMVI S WVY S VAMT I QH I VAE KE H RL K E VMKTMGLNN AVHWVAW F I T G FVQ L S I S VTA 

LTAI LKYGQVLMHSHWI IWLFLAWAVATIMFCFLVSVLYSKAKLASACGGI I YFLS 

YVPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYFALYEVAGVGIQWHTFSQ 

SPVEGDDFNLLIAWMLMVDAWYGILTWYIEAVliPGMYGLPRPWYFPLQKSYW 

RTEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLVVCVDKLTKV 

YKDDKKLALNKLS LNLYENQWS FLGHNGAGKTTTMS I LTGLFP PT S GS AT I YGHDI R 

TEMDEIRKNLGMCPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIRREMDKMIEDLELSN 

KRHSLVQTLSGGMKRKLSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGR 

TILLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGP 

QEPGLASSPPGRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAF 

ERLFQHLERSLDALHLSSFGLMDTTLEEVFLKVSEEDQSLENSEADVKESRKDVLPGA 

EGPASGEGHAGNLARCSELTQSQASLQSASSVGSARGDEGAGYTDVYGDYRPLFDNPQ 

DPDNVSLQEVEAEALSRVGQGSRKLDGGWLKVRQFHGLLVKRFHCARRNSKALFSQIL 

LPAFFVCVAMTVALSVPEIGDLPPLVLSPSQYHNYTQPRGNFIPYANEERREYRLRLS 

PDAS PQQLVSTFRLPSGVGATCVLKS PANGS LGPTLNLSSGESRLLAARFFDSMCLES 

FTQGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGPEMWTSAPSLPRLVRE 

PVRCTCSAQGTGFSCPSSVGGHPPQMRWTGDILTDITGHNVSEYLLFTSDRFRLHRY 

GAI T FGNVLKS I PAS FGTRAP PMVRKI AVRRAAQVFYNNKG YH SMPT YLNS LNNAI LR 

ANLPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDWIAIFIIVAMSFVPASFV 

VFLVA£KSTKAKHLQFVSGCNPIIYWLANYWDMLNYLVPATCCVIILFVFDLPAYTS 

PTNFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYVFLIVINLFIGITATVATFLLQ 

LFEHDKDLKWNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKMKSPFE 

WDIVTRGLVAMAVEGWGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQRVLR 

GDADNDIWKIENLTKWKSRKIGRILAVDRLCLGVTIPGECFGLLGWGAGKTSTFKML 

TGDESTTGGEAFWGHSVLKELLQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGIS 

WKDEARWKWALEKLELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGM 

DPKARRFLWNLILDLIKTGRSWLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKN 

RFGDGYMITVRTKSSQSVKDWRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFS 

KMEQVSGVLGIEDYSVSQTTLDNVFVNFAKKQSDNLEQQETEPPSALQSPLGCLLSLL 

RPRSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC" 

ORIGIN 

Query Match 74.8%; Score 6011; DB 9; Length 6011; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 6011; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 2030 ATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGC 2 08 9 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 1 AT GAT GGAG C G C G C CAT CAT CGAC AC T T T T GT GGG GCAC GACGT G GT GGAGC C AG GCAGC 60 



QY 
Db 



2090 TACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAG 214 9 

I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 TACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAG 12 0 



Qy 215 0 CACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAG 2209 

I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I II I! I I I I I I II II I I I I I I I I I I I 
Db 121 CACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAG 18 0 

Qy 2210 C AC AT C GT G GC G GAGAAG GAG C AC C G G C T C AAG GAGGT GAT GAAGAC CAT G G GC C T G AAC 2269 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CAC AT C GT GGC GGAGAAG GAGC AC C GGCT C AAGGAGGT GAT GAAGAC CAT GG G C C T GAAC 24 0 

Qy 227 0 AACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTG 232 9 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 AACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTG 300 

Qy 2330 AC AGC ACT CAC C G C CAT C CT GAAGT AC GGC C AG GT GCT T AT G CAC AG C CAC GT GGT CAT C 2389 

I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 ACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATC 360 

Qy 2390 ATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCT 244 9 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCT 420 

Qy 2 450 GTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGC 2509 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 GTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGC 4 80 

Qy 2510 TACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCC 2569 

I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 T AC GT G CC CT AC AT GT AC GT GGC GAT C C GAGAGGAGGT GG CG C AT GAT AAGAT CAC GG C C 54 0 

Qy 257 0 TTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTAC 262 9 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTAC 600 

Qy 2630 TTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCG 2689 

I I I I II I I I I I I I II I I I I I I I I I I I II I I II II I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 601 TTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCG 660 

Qy 2690 GTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTG 2749 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I! I I I I I I I I I I I I I I 
Db 661 GTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTG 720 

Qy 2750 GT CTAT GGCAT CCT CACGTGGTACATT GAGGCT GT GCACCCAGGCATGTACGGGCT GCCC 2 809 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GT C TAT GG CAT CCT CAC GT G GT AC AT T GAG GCT GT GCAC C CAG G CAT GT AC GGGCTGCCC 780 

Qy 2810 CGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCC 28 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CGGCC CT GGTACTT CCCACT GCAGAAGT C CT ACT GGCT GGGCAGTGGGCGGACAGAAGCC 84 0 

Qy 2 870 TGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAG 2 92 9 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAG 900 

Qy 2 930 GCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACC 298 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 901 GCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACC 960 

Qy 299 0 CAC CTGCCTCTGGTTGTCTGCGTG G AC AAAC T CAC C AAG GT C T AC AAG G AC G AC AAGAAG 3049 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



961 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I II I 

C AC CTGCCTCTGGTT GT CT G C GT G GACAAAC T CAC CAAG GT CT ACAAG GAC GACAAGAAG 102 0 



3050 CTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGC 3109 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 CTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGC 108 0 

3110 CACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACG 3169 

I I I I I I I I I I I I II I I I II I I I 1 I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I 
1081 CACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACG 114 0 

317 0 TCGGGTTCCGC CAC CAT C T AC G G G CAC GAC AT C C G CAC G GAG AT G GAT GAG AT C C G CAAG 322 9 

I I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1141 TCGGGTTCCGC CAC CAT CT ACGGG CAC GAC AT C C G CAC G GAGAT GGAT GAGAT C C G CAAG 1200 

323 0 AACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACAC 32 8 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 AACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACAC 12 60 

3290 CT CT GGT T CT ACT CAC GGCT CAAGAGC AT G G CT C AGGAGGAGAT C C GC AGAG AGAT GGAC 334 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 CTCTGGTTCTACTCACGGCT CAAGAGCAT GGCT CAGGAGGAGATCCGCAGAGAGAT GGAC 132 0 

3350 AAGAT GAT CGAGGACCT GGAGCT CTCCAACAAACGGCACT CACT GGTGCAGACATT GT CG 3409 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1321 AAGAT GAT C GAGGAC CT GGAGCT C T C CAAC AAAC GGC AC T CACT GGT G CAGAC AT T GT C G 1380 

3410 GGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATC 34 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 GGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATC 14 4 0 

34 7 0 ATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTC 352 9 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 
1441 ATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTC 15 00 

3530 AT CCT GAAGT ACAAG C CAGGC C GC AC CAT C CTT CT GT CC AC C CAC CAC AT GGAT GAGG C T 3589 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 AT C CT GAAG T ACAAG C CAGGC C GC AC C AT CCTTCTGTCC AC C CAC CAC AT GGAT GAGG CT 1560 

3590 GACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCC 364 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I II I 
1561 GACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCC 162 0 

3650 CCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCC 37 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 CCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCC 168 0 

3710 GCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCG 3769 

I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1681 GCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCG 17 4 0 

377 0 CTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGC 382 9 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1741 CTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGC 18 00 

3830 CTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAG 38 89 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 



1801 CTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAG 18 60 



38 90 AAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTC 

I I I I I I I I I M I I I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I I II I I I I I I I 
18 61 AAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTC 



3949 



1920 



4009 



3950 AGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAG 
I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 AGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAG 1980 

4010 GAT CAGT C GCT G GAGAAC AGT GAGGC C GAT GT GAAG GAGT C CAGGAAGGAT GT GCT C C CT 4069 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1981 GAT CAGT C G CT G GAGAAC AGT GAG GC C GAT GT GAAGGAGT C CAGGAAGGAT GT GCT C C C T 2 040 

4 070 GGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAG 4129 

II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II I 
2041 GGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAG 2100 

4130 CTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGAC 4189 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 CTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGAC 2160 

4190 GAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAG 4249 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 GAG GGAGCT GG C TACAC C GAC GT C TAT G GC GACT AC CGCCCCCTCTTT G AT AAC C CAC AG 2220 

4250 GACC CAGACAAT GT CAGC CT GCAAGAGGT GGAGGC AGAGGCCCT GT C GAGGGT CGGC CAG 4309 

I | | I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 GACCCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAG 2280 

4310 GGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTC 4369 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
22 81 GGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTC 2340 

437 0 AAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCA 4429 

I I I I I I I II I I I I I I I I I I I I I M I I I I I I II M I I I I I I I I I I I I I I I I I II I I I I I I I 

2341 AAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCA 24 00 

4430 GCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTG 44 8 9 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
24 01 GCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTG 2460 

44 90 CCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTC 4 549 

I I I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I II I I I I I I I I I I I I Ml 

2 4 61 CCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTC 2520 

4550 ATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGC 4 609 

I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I 

2521 ATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGC 258 0 

4610 CCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTC 4669 

I I I I I II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 CCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTC 2 64 0 

4 67 0 AAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGC 4 72 9 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I M 
2 641 AAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGC 2700 
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CTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCA 47 8 9 

I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I 

CTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCA 27 60 

CTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCG 484 9 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCG 282 0 

GATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGG 4909 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
GATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGG 28 80 

ACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCG 4 9 69 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
ACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCG 294 0 

CAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTG 502 9 

I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTG 3000 

GTCACAGGCGACATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTC 50 89 

I | | | | I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I M I I I I 

GT C AC AG G C GAC AT C CT GAC C GACAT CAC C G GC C ACAAT GT C T CT GAG T AC CTGCTCTTC 30 60 

ACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAG 514 9 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I 
ACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAG 3120 

TCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGC 52 09 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
TCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGC 318 0 

AGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAAC 52 69 

I | I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
AGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAAC 3240 

AGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCT 532 9 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCT 3300 

T AC G G CAT CAC C GT CAC C AAC CAC C C CAT G AAT AAGAC C AG C GC C AG CCTCTCCCTG GAT 538 9 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I 
T AC GGCAT CAC C GT CACCAAC CAC C C CAT GAAT AAGAC CAGC GC C AGC C T CT C CCT GG AT 33 60 

TACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTC 54 4 9 

I I I I II I I I I I I II I I I I I I I I I I I I I II M I I I I I I I M I I I I I I I I I I I I I I I I M I I 

TACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTC 342 0 

GTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTG 5509 

I || || I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I 
GTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTG 34 8 0 

CAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATG 5569 

I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I 
CAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATG 354 0 
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CTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCG 562 9 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I I I I M I I I I I I I I I I 

CTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCG 3600 

GCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGG 5689 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
GCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGG 3660 

TCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTAC 5749 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I M I I I I I I I I I M I 
TCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTAC 372 0 

GTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTG 58 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I II I I I I I 

GTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTG 37 80 

C TACAGCT CTT CGAGC AC GACAAG GAC CT GAAGGT T GT CAAC AGT T ACC T GAAAAG CT G C 58 69 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
CTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGC 384 0 

TTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAG 592 9 

I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I II I I I 

T T C CT CAT T T T C C C CAAC T ACAAC CT GGGC C AC G G GCT CAT GGAGAT GGC CT ACAAC GAG 3900 

T AC AT CAAC G AGT AC T AC G C C AAG AT T G G C C AGT T T GACAAG AT GAAGT CCCCGTTC GAG 598 9 
I I I I I I M I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I 
T AC AT CAAC GAG T AC T AC G C C AAGAT T GG C C AGT T T GAC AAGAT GAAGT C C C C GT T C GAG 3960 

TGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTC 604 9 

I | | I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

TGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTC 4 020 

C T GAC CAT CAT GT G C C AGT ACAACT T CCTGCGGC GGC C AC AGC GC AT G C CT GT GT C T AC C 6109 

I | | | I || I I I I I | | I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I 
CTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACC 4 0 8 0 

AAGCCT GT G GAGGAT GAT GT GGAC GT GGC C AGT G AGC GGC AG C GAGT GCT C C GGGGAGAC 6169 

I | | | I I I I I I I I I I I I I II II I I I I I I I I I I I I It I I I I I I I I I M I I I II I I I I I I I I I 

AAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGAC 4140 

GCCGACAAT GACAT GGT CAAGATT GAGAACCT GACCAAGGT CT ACAAGT CC CGGAAGATT 622 9 
I I I I I I II I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
GCCGACAAT GACAT GGT CAAGATT GAGAACCT GAC CAAGGT CTACAAGT CCCGGAAGATT 42 00 

GGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGG 6289 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I II I I I I I I I I I I I 

GGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGG 42 60 

CTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAG 6349 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAG 4320 

AGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAG 64 09 

| || | | | I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

AGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAG 438 0 

6410 GTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCC 64 69 
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I M | | | | | | | | | | | I I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I 

GTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCC 

CGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGG 

| | | M II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
CGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGG 



4440 



6529 



4500 



6589 



GTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGC 

| || | | | | | I | | | | | I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGC 4560 

ACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCA 664 9 

| | | | I I I I I I I I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I M II I I I 
ACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCA 4 62 0 

GCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTC 6709 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I! 

GCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTC 468 0 

T G GAAC C T CAT C CT C GAC CT CAT C AAGAC AG G GC GT T C AGT G GT GCT G AC AT C AC AC AG C 67 69 
| | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
T GGAAC CT CAT C CT C GAC CT CAT CAAGACAGGGC GT T C AGT GGT G CT GACAT C AC ACAGC 4740 

ATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGG 6829 

I I I M I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

ATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGG 4 800 

T GC CT GG GCAGC AT CC AGC AC CT GAAGAAC CG GT T T GG AGAT GGCT AC AT GAT CAC GGT G 6889 
| | | I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I II I I I I I I I II I I I I I I 
TGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTG 48 60 

C GGAC CAAGAG CAGC C AGAGT GT GAAGGAC GT G GT GC GGTT CT T CAAC C GCAACT T C C C G 6949 

ii him i 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 

CGGACCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCG 4920 
GAAGCCATGCT CAAGGAGCGGCAC CACACAAAGGT GCAGTACCAGCT CAAGT CGGAGCAC 7009 

I | | | | | I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I 

GAAGCCAT GCT CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCT CAAGT CGGAGCAC 4 980 
ATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAG 7069 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

ATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAG 5040 
GACTACT CGGT CAGCCAGACCACACT GGACAAT GTGTT C GT GAACTTT GCCAAGAAGCAG 712 9 

I I I I I I I I II I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

G ACT ACT CG GT C AGC CAG AC CAC ACT GGACAAT GT GT T C GT GAAC T T T GCCAAGAAGCAG 5100 

AGTGACAACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGC 7189 

I I II I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I M II 

AGT GACAAC CT GGAG C AGC AGGAGAC GGAG CC GC CAT C C GC AC T G CAGT CC C CT C T C GGC 5160 

TGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCA 7249 

Ml I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

TGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCA 522 0 

GAC GAG C C C GAGG AC C T GGAC AC GGAG GAC GAGG G C C T CAT C AGCT T C GAG GAGG AGC G G 7309 

I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 
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5221 GAC GAGC C C GAG GAC CT G GAC ACG GAGG AC GAGGGC CT CAT C AGCTT C GAG GAG GAG C G G 5280 

GCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGG 7369 

I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I 

GCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGG 5340 

ACACG CT C C AC T GAC C AC C CAGAG CT GGG C C AGGGACT CAACAAT GGG GAC AGAAGT C C C 7429 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

AC AC G C T C C ACT GAC C AC C C AGAGCT G G G C C AG G GACT CAACAAT GG GGAC AGAAGT C C C 5400 

CCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGC 74 89 

I I I I I I I I II II I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

CCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGC 54 60 
CCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGC 7549 

I II I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

CCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGC 552 0 

TGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGC 7609 

III 11 I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 

TGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGC 5580 

CCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGG 7669 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I II I I I II I I I I I I II I 
CCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGG 5640 

CACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGC 7729 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

CACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGC 5700 

TGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAG 7789 

I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
TGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAG 5760 



AAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCA 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

AAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCA 



7849 



5820 



7909 



GCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGG 

| M | I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 
GCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGG 588 0 

GCCAGACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCC 7 969 

I 1 I I I 1 I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

GCCAGACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCC 5940 

GCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATA 8029 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATA 6000 



I I I I I I I I I I I 



RESULT 11 
AX088339 



LOCUS AX088339 6006 bp DNA linear PAT 17-MAR-2001 

DEFINITION Sequence 3 from Patent WO0114414. 
ACCESSION AX088339 

VERSION AX088339.1 GI: 13397235 

KEYWORDS 

SOURCE Homo sapiens (human) 

ORGANISM Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. 
REFERENCE 1 

AUTHORS le Bihan,S., Wilson, C. and Charest, D . L. 
TITLE Human abc2 transporter and uses thereof 

JOURNAL Patent: WO 0114414-A 3 01-MAR-2001; 

Activepass Pharmaceuticals, Inc. (CA) 
FEATURES Location/Qualifiers 
source 1. .6006 

/organism="Homo sapiens" 
/mol_type="unassigned DNA" 
/db_xref="taxon: 9606" 
CDS 1. .6006 

/note="unnamed protein product" 

/codon_start=l 

/protein_id="CAC34 695 .1" 

/db_xref="GI : 13397236" 

/ db_xr e f = " REMT REMBL : C AC 34695" 

/ translation="MSSLGFTSKEQRNLGLLVHLMTSNPKILYXPAGSEVDRVTLKAN 
ETFAFVGNVTHYAQVWLNISAEIRSXLEQGRLQQHLRWLQQYVAELRPHPEALNLSLD 
ELPPALRQDNFSLPSGMALLQQLDTIDNAPCGWIQFMSKVSVDIFKGFPDEESIVNYT 
LNQAYQDNVTVFAGVIFQTRKDGSLPPHVHYKIRQNSSFTEKTNEIRRAYWRPGPNTG 
GRFYFLYGFVWIQDMMERAIIDTFVGHDWEPGSYVQMFPYPCYTRDDFLFVIEHMMP 
LCMXISWVYSVAMTIQHIVAEKEHRLKEVMKTMGLNNAVHWVAWFITGFVQLSISVTA 
LTAILKYGQVLMHSHWIIWLFLAVYAVATIMFCFLVSVLYSKAKLASAGGIIYFLSY 
VPYMYVAIREEVAHDKITAFEKCIASLMSTTAFGLGSKYF7VLYEVAGVGIQWHTFSQS 
PVEGDDFNLLLAVTMLMVDAWYGILXWYIEAVHPGMYGLPRPWYFPLQKSYWLGSGR 
TEAWEWSWPWARTPRLSVMEEDQACAMESRRFEETRGMEEEPTHLPLWXVDKLTKVY 
KDDKKLALNKLSLNLYENQGVS FLGHNGAGKTTTMS I LTGLFP PT SGS AT I YGHDIRT 
EMDEIRKNGHVPQHNVLFDRLTVEEHLWFYSRLKSMAQEEIPREMDKMIEDLELSNKR 
HSLVQTLSGGMKRKVSVAIAFVGGSRAIILDEPTAGVDPYARRAIWDLILKYKPGRTI 
LLSTHHMDEADLLGDRIAIISHGKLKCCGSPLFLKGTYGDGYRLTLVKRPAEPGGPQE 
PGLASSPPGRAPLSSCSELQVSQFIRKHVASCLLVSDTSTELSYILPSEAAKKGAFER 
LFQHLERSLDALHLSSFGLMDTTLEEVFLKVSGGDQSLENSGADVKESRKDVLPGAEG 
HASGEGHAGNLARCSELTQSQASLQSASSVGSALGDEGAGYTDVYGDYPPLFDNPQDP 
DNVSLQEVEAEALSRVGQGS RKLDGGWLKVRQFHGLLVKRFHCAIIRNS KALFSQI LLP 
AFFVCVAMTVALSVPEI GDLPPLVLS P SQYHNYTQPRGNFI P YANEERREYRLRLS PD 
ASPQQLVSTFRLPSGVGATCVLKSPANGSLGPTLNLSSGESRLLAARFFDSMCLESFT 
QGLPLSNFVPPPPSPAPSDSPASPDEDLQAWNVSLPPTAGQEMWTSAPSLPRLVREPV 
RCTCSAQGTGFSCPNSVGGHPPQMRWTGDILTDITGHNVSEYLLFTSDRFRLHRYGA 
I T FGNVLKS I PAS FGTRAP PMVRKI RCARAAQVFYNNKGYHSMPT YLN S LNNAI LRAN 
LPKSKGNPAAYGITVTNHPMNKTSASLSLDYLLQGTDWIAIFIIVAMSFVPASFWF 
LVAEKSTKAKHLQFVSGCNPIIYWLANYVWDMLNYLVPATCCVIILFVFDLPAYTSPT 
NFPAVLSLFLLYGWSITPIMYPASFWFEVPSSAYXFLIVINLFIGITATVATFLLQLF 
EHDKDLKWNSYLKSCFLIFPNYNLGHGLMEMAYNEYINEYYAKIGQFDKMKSPFEWD 
IVTRGLVAMAVEGWGFLLTIMCQYNFLRRPQRMPVSTKPVEDDVDVASERQRVLRGD 
ADNDMVKIENLTKVYKSRKIGRILAVDRLCLGVRPGECFGXLGVNGAGKTSTFKMLTG 
DESTTGGEAFVNGHSVLKELXQVQQSLGYCPQCDALFDELTAREHLQLYTRLRGIXWK 
DEARWKWALEKLELTKYADKPAGTYSGGNKRKLSTAIALIGYPAFIFLDEPTTGMDP 
KARRFLWNLILDLIKTGRSWLTSHSMEECEALCTRLAIMVNGRLRCLGSIQHLKNRF 



GDGYMITVRTKSSQSVKDWRFFNRNFPEAMLKERHHTKVQYQLKSEHISLAQVFSKM 
EQVSGVLGIEDYSVSQTTLDNVFWFAKKQSDNLEQQETEPPSALQSPLGCLLSLLRP 
RSAPTELRALVADEPEDLDTEDEGLISFEEERAQLSFNTDTLC" 



ORIGIN 



Query Match 73.6%; 
Best Local Similarity 99.2%; 
Matches 5965; Conservative 



Score 5915.4; 
Pred. No. 0; 
9; Mismatches 



DB 6; Length 6006; 
32; Indels 6; Gaps 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1334 ATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTC 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I 
1 ATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTC 



3; 



1393 



60 



1394 ATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATC 1453 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I : I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
61 ATGACCAGCAACCCCAAAATCCTGTACGSGCCTGCGGGCTCTGAGGTCGACCGCGTCATC 120 

1454 CTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGG 1513 

I | | | I I I I I I M I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 CTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGG 180 

1514 CTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTG 1573 

I I I I I I I I I I I I I I I I I I I I II I I I I I I : I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 
181 CTCAACATCTCGGCGGAGATCCGCAGCTYCCTGGAGCAGGGCAGGCTGCAGCAACACCTG 24 0 

1574 CGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCA 1633 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 11 I I 
241 CGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCCGCACCCCGAGGCACTGAACCTGTCA 300 

1634 CTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCC 1693 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
301 CTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCC 360 

1694 CTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCC 1753 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
361 C T C CT ACAGCAGCT GGAT AC CAT T GAC AAC GC GC CCTGCGGCT GGAT C CAGT T CAT GT C C 420 

1754 AAG GT GAGC GT GGAC AT CT T CAAG GG CTT C C C C GACGAGGAGAGC AT T GT C AACT AC AC C 1813 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 1 I I I I I I I I I I 
421 AAGGT GAG C GT GGACAT CTT CAAGGGC TT C C C C GAC GAGGAGAGC AT T GT CAACT ACACC 48 0 

1814 CTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGG 1873 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 
481 CTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCGGTGTGATCTTCCAGACCCGG 



540 



187 4 AAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCCAGCTTCACC 1933 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I 

541 AAGGAC G G CT C GCT C C C GC CT CAC GT G C AC T AC AAGAT C C G C C AGAACT C C AG CT T C AC C 600 

1934 GAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGC 1993 

II I I I I | | I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I 

601 GAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGC 660 



Qy 

Db 



1994 TTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGAC 
I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I 
661 T T CT ACTT C CT CT AC G GCT T C GT CT GGAT C C AGGACAT GAT GGAGC G C G C CAT CAT C GAC 



2053 



720 



Qy 


2054 


Db 


721 


Qy 


2114 


Db 


781 


Qy 


2174 


Db 


841 


Qy 


2234 


Db 


901 


Qy 


2294 


Db 


961 


Qy 


2354 


Db 


1021 


Qy 


2414 


Db 


1081 


Qy 


2474 


Db 


1141 


Qy 


2534 


Db 


1198 


Qy 


2594 


Db 


1258 


Qy 


2654 


Db 


1318 


Qy 


2714 


Db 


1378 


Qy 


2774 


Db 


1438 


Qy 


2834 


Db 


1498 


Qy 


2894 



ACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCC 2113 

I I I I I I I I I I I I I I II I I I 11 I II I I I I I II I I I I I I I I > I I I M I I I I I I I I I I I I I I I 
ACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCC 780 

TGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTG 2173 

I I I II I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I ' I 
TGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGYG 840 

ATCTCCTGGGT CTACTCCGTGGCCAT GACCATCCAGCACAT CGT GGCGGAGAAGGAGCAC 2233 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M 
AT CTCCTGGGT CT ACT C C GT GG CC AT GAC C AT CC AGC ACAT C GT G G C G GAGAAGGAG C AC 90 0 

CGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGG 22 93 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
CGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGG 960 

TTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAG 2353 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
TTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAG 1020 

TACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTAC 2413 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

TACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTAC 1080 

GCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTG 2473 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
GCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTG 1140 

GCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCG 2533 

I I I I I M I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

GCCTCGGC TGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCG 1197 

AT C C GAG AG GAG GT G G C G CAT G AT AAG AT C AC G G C CT T C G AG AAG T G CAT CGCGTCCCTC 25 93 

I I I I I I I I I I I I I I I I I I I I I I 1 M I I I I I I I i I I I ! I I I I I I I I I I I I I I I I I I I I I I I 

AT CC GAGAG GAGGT G GC G CAT GAT AAG AT C AC GGC CT T C GAGAAGT G CAT C GC GT CC CT C 1257 

ATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGC 2653 

I | | | | | | | II I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGC 1317 

GTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTG 2713 

I I I I I I I I I I I I I I I I I I I I M I I I I I II I I II I I I I I I I II I I I I I I I I I I I I I II I I I 
GTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTG 1377 

CTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTAC 2773 

I I I I I I I I I I I I I I I I II I I I I II I I I II I I I I I I I I I I I I I I II I I I M I : I I I I I II I 
CTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCMCGTGGTAC 1437 

ATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAG 2 833 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
ATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAG 1497 

AAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCA 28 93 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCA 1557 

28 94 CGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGC 2953 



I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 155 8 CGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGC 1617 

Qy 2954 TTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTG 3013 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I : I I I I 
Db 1618 TTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTKCGTG 1677 

Qy 3014 G AC AAAC T C AC C AAG G T C T AC AAG G AC G AC AAG AAG CTGGCCCT G AAC AAG C T GAG C C T G 3073 

I I II M I I I I I i I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1678 GACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAACAAGCTGAGCCTG 1737 

Qy 3074 AACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACC 3133 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 173 8 AACCTCTACGAGAACCAGGGGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACC 1797 

Qy 3134 ACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGG 3193 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I 
Db 17 98 ACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGG 1857 

Qy 3194 CACGACAT C C G CACG GAGAT GGAT GAGAT C C GC AAGAAC CT GGG CAT GT GC C CG C AG C AC 3253 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1858 CACGACAT C C GCAC GGAGAT GGAT GAGAT C C GCAAGAAC - - GG G CAT GT GC C C - C AG C AC 1914 

Qy 3254 AATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAG 3313 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

Db 1915 AATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAG 1974 

Qy 3314 AGCAT GGCT CAGGAGGAGAT CC GCAGAGAGAT GGACAAGAT GAT C GAGGACCT GGAGCT C 3373 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1975 AGCAT GGCT C AGGAG GAGAT C C C C AGAGAGAT G GACAAGAT GAT C GAGGAC C T G GAGCT C 2034 

Qy 3374 T C CAACAAAC G GCACT C ACT GGT G CAGAC AT T GT C GGGT GGC AT GAAG CGCAAG CT GT C C 3433 

I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2035 T C CAACAAACG GCACT CACT GGT G CAGACAT T GT C GG GT GGC AT GAAG C GCAAGGT GT C C 2094 

Qy 3434 GTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGC 3493 

I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2095 GTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGC 2154 

Qy 34 94 GTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGC 3553 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2155 GTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGC 2214 

Qy 3554 ACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCC 3613 

I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2215 ACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCC 2274 

Qy 3614 ATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTAT 3673 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 
Db 2275 ATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTAT 2334 

Qy 3674 GGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAG 3733 

I I I I I I I II II I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I II I I I 
Db 2335 GGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAG 2394 

Qy 3734 CCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAG 3793 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 



2395 CCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCTCTGAGCAGCTGCTCCGAGCTCCAG 2454 

37 94 GTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACG 3853 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I 
2455 GTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACG 2514 

3 854 GAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTC 3913 

| I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2515 GAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTC 2574 

3914 CAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACG 3973 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I I 

2575 CAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACG 2 634 

397 4 AC C CT GGAGGAAGT GT T C CT CAAG GT GT C GGAG GAGGAT C AGT C G CT GGAGAACAGT GAG 4 033 

I I I II II I I I I I I I I I I I I I II I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
2 635 ACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGGGGGGGATCAGTCGCTGGAGAACAGTGGG 2 694 

4034 GCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGG 4 093 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2695 GCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCACGCGTCTGGG 2754 

4094 GAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTG 4153 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I I 
2755 GAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTG 2 814 

4154 CAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTC 4213 

I I I I I I I I I I I I I I I I I II I Ill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2815 CAGTCGGCGTCATCTGTGGGCTCTGCCCTGGGCGACGAGGGAGCTGGCTACACCGACGTC 2 87 4 

4214 TAT G G C G AC T AC CGCCCCCTCTTT GAT AAC C C AC AG G AC C C AG AC AAT GT C AG C C T G C AA 4273 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 875 T AT GGCGACTACCC C CCCCT CTTT GATAACCCACAGGAC C CAGACAAT GT CAGCCTGCAA 2 934 

4274 GAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGG 4333 

I I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2935 GAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGG 2 994 

4334 TGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGC 4393 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
29 95 TGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGC 3054 

4394 AACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATG 4453 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
3055 AACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATG 3114 

4454 ACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCC 4513 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3115 ACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTTCCCCCGCTGGTCCTGTCACCTTCC 3174 

4514 CAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGC 4573 

I I I II I I I I I I I I II II I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I M 
317 5 CAGT ACCACAACT AC AC CC AG CCCCGTGG CAAT T T CAT C C C CT AC G C CAAC GAG G AGC G C 3234 

457 4 CGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTC 4 633 

I I I I I I I I I I I I II I II I I I I I I I I II I I I I I I I I I II I I I I II I I I I I II I I I I I I I I I 
3235 CGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTC 3294 



Qy 


4634 


Db 


3295 


Qy 


4694 


Db 


3355 


Qy 


4754 


Db 


3415 


Qy 


4814 


Db 


3475 


Qy 


4874 


Db 


3535 


Qy 


4934 


Db 


3595 


Qy 


4994 


Db 


3655 


Qy 


5054 


Db 


3715 


Qy 


5114 


Db 


3775 


Qy 


5174 


Db 


3835 


Qy 


5234 


Db 


3895 


Qy 


5294 


Db 


3955 


Qy 


D O 3 fi 


Db 


4015 


Qy 


5414 


Db 


4075 



CGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTG 4 693 

I I I I I I I I I I I I M I I I I I I I I I 1 I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I I I I 

CGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTG 3354 

GGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGAC 4 753 

I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGAC 3414 

AGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCA 4813 

I I I I I I I I II I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
AGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCAAATTTCGTGCCACCCCCA 3474 

CCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAAC 4873 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
CCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAAC 3534 

GTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGC 4933 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTCTCCCTGCCGCCCACCGCTGGGCAAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGC 3594 

CTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCC 4993 

I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCC 3654 

AGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGAC 5053 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGAC 3714 

ATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCAC 5113 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
ATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCAC 3774 

CGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACC 5173 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
CGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACC 3834 

AGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAAC 5233 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

AGGGCCCCACCCATGGTGCGGAAGATCCGGTGCGCCAGGGCTGCCCAGGTTTTCTACAAC 3894 

AACAAGG GCT AT C AC AGC AT GC C CAC CT AC C T C AACAGC CT CAACAAC G C CAT C CT G C GT 5293 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACAAGGGCT AT CAC AG C AT GC CCAC CT AC CT CAAC AG C CT C AACAAC GC C AT C C T GC GT 3954 

GCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCAC 5353 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I I I I I I 
GCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCAC 4 014 

CCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTC 5413 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I 
CCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTC 4074 

GTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTC 54 73 

I I I I I I I II I I I I II II I II II I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I 

GTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTC 4134 



Qy 


5474 


CTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 
CTCGTGGCCGAGAAGTCCACCAAGGCCAAGCACCTGCAGTTTGTCAGCGGCTGCAACCCC 


c c o o 

5533 


Db 


4135 


A 1 ft A 

4194 


Qy 


5534 


ATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACC 
I I I I I I I I I I I I M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I i 1 1 
ATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACC 


C CO O 


Db 


4195 


/IOC/ 

4254 


Qy 


5594 


TGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTC 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I 1 1 1 I 1 1 1 1 1 

TGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTC 


5653 


Db 


4255 


4314 


Qy 


5654 


CCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCG 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1! 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 
CCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCG 


5713 


Db 


4315 


4374 


Qy 

Db 


5714 
4375 


GCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTC 
1 1 ! 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 : 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 
GCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGKGTTCCTCATTGTCATCAATCTC 


5773 
4434 


Qy 


5774 


TTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAG 
1 M I 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAG 


5833 


Db 


4435 


4494 


Qy 


5834 


GACCT GAAGGTT GT C AACAGTT ACCT GAAAAGCT GCT T C CT CATTTT C C CC AACT ACAAC 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GAC CT GAAG GT T GT C AAC AGT T AC CT GAAAAG CTGCTTCCT CAT T T T C C C C AACT ACAAC 


5893 


Db 


4495 


4554 


Qy 


5894 


CT GGG C CAC G GG C T CAT G GAGAT GGC CT AC AAC GAGT ACAT CAAC GAGT ACT AC GC CAAG 
I I || I I I I I I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
C T G GGC CAC GG G CT CAT GGAGAT G GC CT ACAAC GAGT ACAT CAAC GAGT ACT AC G C CAAG 


5953 


Db 


4555 


4614 


Qy 


5954 


AT T G G C C AGT T T G AC AAG AT G AAGT CCCCGTTC GAGT G G GAC AT T GT CAC C C G C G GAC T G 

M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
ATTGGCCAGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTG 


6013 


Db 


4615 


4674 


Qy 


6014 


GTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAAC 

M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 11 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 

GTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAAC 


6073 


Db 


4675 


4734 


Qy 


6074 


TTCCTGCGGCGGC C AC AGC GCAT G CCT GT GT CT AC CAAG C C T GTGGAGGAT GAT GT GGAC 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 
TTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGAC 


6133 


Db 


4735 


4794 


Qy 


6134 


GT GGC C AGT GAGC GGCAGC GAGT GCT C C GGGGAGAC GC C GACAAT GACAT GGT CAAGAT T 
I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 
GTGGCCAGTGAGCGGCAGCGGGTGCTCCGGGGAGACGCCGACAATGACATGGTCAAGATT 


6193 


Db 


4795 


4854 


Qy 

Db 


6194 
4855 


GAGAACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGC 
1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 
GAGAAC CT GAC CAAG GT C T AC AAGT C CC GGAAGAT T GGC C GT AT C CT GG CC GT T GAC C GC 


6253 
4914 


Qy 


6254 


CTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGC 

I | | | | 1 II 1 1 1 M 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 : 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 
CTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCYCCTGGGCGTCAACGGTGCGGGC 


6313 


Db 


4915 


4974 


Qy 


6314 


AAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTC 


6373 



Db 


4975 


Qy 


6374 


Db 


5035 


Qy 


6434 


Db 


5095 


Qy 


6494 


Db 


5155 


Qy 


6554 


Db 


5215 


Qy 


6614 


Db 


5275 


Qy 


6674 


Db 


5335 


Qy 


6734 


Db 


5395 


Qy 


6794 


Db 


5455 


Qy 


6854 


Db 


5515 


Qy 


6914 


Db 


5575 


Qy 


6974 


Db 


5635 


Qy 


7034 


Db 


5695 


Qy 


7094 


Db 


5755 


Qy 


7154 



1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAGAC CAG CAC CT T CAAGAT GCT GAC C G G C GAC GAGAG CAC G AC GGGGGGC GAG G C CT T C 5034 

GTCAAT GGACACAGCGT GCTGAAGGAGCT GCT CCAGGTGCAGCAGAGCCTCGGCTACT GC 6433 
I M I I I I I I I I I II I I I I II I I I I I I I I II I : I I I I I I I I I I I I I I I I I I I I I II I I I M 
GTCAATGGACACAGCGTGCTGAAGGAGCTGCHCCAGGTGCAGCAGAGCCTCGGCTACTGC 5094 

CCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACG 64 93 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACG 5154 

CGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAG 6553 

I I I II I I I I I I I I I : I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CGGCTNCGTGGGATCYCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAG 5214 

CTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGG 6613 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
CTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGC7UVCAAGCGG 5274 

AAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCC 6673 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCC 5334 

ACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATC 6733 

I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTTGACCTCATC 5394 

AAGACAGGGCGTT CAGT GGT GCT GACAT CACACAGCAT GGAGGAGTGCGAGGC GCT GT GC 6793 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
AAGAC AGG GC GT T CAGT GGT G CT GAC AT CACACAGCAT G GAGGAGT G C GAGGC G C T GT GC 54 54 

ACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTG'CCTGGGCAGCATCCAGCACCTG 6853 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

ACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTG 5514 

AAGAAC C G GT T T G GAGAT G GCT AC AT GAT CAC GGT GC G GACCAAGAG CAGC C AGAGT GT G 6913 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I 
AAGAAC C GGT T T GGAGAT GGCT ACAT GAT CAC GGT GC G GAC CAAGAGC AGC C AGAGT GT G 5574 

AAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCAC 6973 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCAC 5634 

C ACACAAAGGT GCAGTAC CAGCT CAAGT CGGAGCACAT CT C GCT GGCCCAGGT GTT CAGC 7 033 
I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 
CACACAAAGGTGCAGTACCAGCT CAAGT CGGAGCACAT CTCGCT GGCCCAGGT GTT CAGC 5 694 

AAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACA 7093 
I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
AAGAT G GAGCAGGT GT C T GGC GT G CT GGGC AT C GAG GACT AC T C GGT CAGC CAGAC CAC A 5754 

CT G GACAAT GT GT T C GT GAACT TT GC CAAGAAGC AG AGT G ACAAC C T G GAG CAGC AGGAG 7153 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
CTGGACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCTGGAGCAGCAGGAG 5814 

ACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCC 7213 
I I I II I I I I I I I I I I I I I I I I I I I I I II M II I I I I I I I I II I I I I I I I I I I I I I I I t I I 



Db 5815 ACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCC 5 87 4 

Qy 7214 CGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACG 7273 

I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I 
Db 5875 CGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACG 5934 

Qy 7274 GAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGAC 7333 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I II I I I I I 

Db 5935 GAG GAC GAG G G C C T CAT CAGCT T C GAGGAGGAGC GG GC C CAGCT GT C C T T CAACAC GG AC 5994 

Qy 7334 ACGCTCTGCTGA 7345 

! II I I I I I I I I I 
Db 5995 ACGCTCTGCTGA 6006 
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Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 93 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
Db 94 GCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGGAGCCCGTGGGTCCTGGCGTTTGAGAT 153 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 180 

I I I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 154 CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 213 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 240 

I I I I I I I I I I I I I I I I I I I I I I II II II I I I II II I I I II I I I I I 11 II 
Db 214 CTCTGTGAAGGAAG CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Mill I I I I I I I I I I I I I I II 
Db 271 TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 330 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 331 CAACT C CAC GGT CAC C C AGCT T CT GGAAC G C CT CAAC C GT GT AGT GGAAGAGAG C AACT T 390 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I I I I I I II I I I Ml M I I I I I I I M I II II M I II II I II I III I I I I II I 

Db 391 GTTTGACCCAGAGCGACCTAGCCTGGGCTCAGAGCTTGAGGCACTGCACCAACGTCTGGA 450 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 480 

I I I II I I II I II I I I I M I I II I I I I M II II I II I I I I I I II I I 

Db 451 GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 510 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 

II I I I I I II I I I II I I M II I II I II I I I I I I II II M I I I M I I M I I 

Db 511 CTTCTCTCTGGACTCGGTGGCCAGGGACA7\AAGAGAGCTTTGGCGTTTCCTGATGCAGAA 570 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I I II II M II I II I I M I I II III MM II I I M I I I II I I I II 

Db 571 CCTGTCACTGCCCT^ACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

M II I I I I II I I I I I M I II I I I II M II II I I I I I M I I I II 
Db 631 GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 690 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 72 0 

I II I II II II I II II I M I II I I M I II II II II I I I I I II I II II I I I 

Db 691 GAAGCAGGAGCCCTGGAGTCACCTGGGTAGCAATCCTCTGTTCCAAATGGAGGAGCTGCT 750 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

II II II I II II I I II II I I II I I II II I I I II II I II II M II I II II I I I 

Db 751 GCTGGCTCCTGCCCTTTTGGAGCAACTCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 810 

Qy 781 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 

I I I M II II I I I II I II I I I I I I I II I II II II II II I II M I M II I I I 
Db 811 GATTCTTACCATGCCTGAGGGTCATCAGGTAGACCTTCAGGGCTACCGGGATGCTGTCTG 87 0 

Qy 841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 



I I I I I I II I I I I I I I I I I I I I II III II II I I II I I I I I II ! I I 

Db 871 CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 93 0 

Qy 901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 931 CCAGCTGGACATAGCCAAGATTGCCCAGCAGCTGGGCTTCAATGTCCCCAACGGCTCAGA 990 

Qy 961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I M I I I I I I II I I I I II Ml I I I I I I I I II I I I I I I I II I I I I I I 
Db 991 TCCACAGCCGCAGGCACCGTCCCCACAGAGTCTGCAGGCACTCTTAGGGGACCTGCTGGA 1050 

Qy 1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Mill I II II II I I I I I I II 

Db 1051 TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 1110 

Qy 1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

I I I II I I I II I I I I II M I II I I I I I I I I I I II I II I I II II I I 

Db 1111 AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 1170 

Qy 1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I I I I I I II I I I II I I II I I I M I II II II II I I I I II 
Db 1171 CAGCACCGGGGTAGGGGCAAATACAGGTCCCAACACCACCGTTGAGGAGGGCACCCAGTC 1230 

Qy 1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

III II I I I I II II I I I I I I I I I I I I II I II I II M I I II I I M I II 
Db 1231 ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 1290 

Qy 1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I I I I II III I II I I I I II I I I M I I I I II I M I I I I I II II II II II II II I I 
Db 1291 CTGGGCTGGCTTGCAGCCCATCTTGTGTGGCAACAACCGTACCATTGAGCCTGAAGCACT 1350 

Qy 1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

II I I I I II I II I I I I II M I II I I I I I I I II I I I I II II I I I I II I I I M I II 

Db 1351 CCGGAGGGGCT^ACATGAGCTCACTGGGCTTTACGAGCAAAGAACAACGGAACCTGGGCCT 1410 

Qy 1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

I I I I M I I I I II I II II I I II I I M I M I I II I I I I I II II II I I I I I II I I 

Db 1411 TCTTGTGCACCTCATGACCAGCAACCCCAAT^ATCCTGTATGCACCCGCAGGCTCTGAAGC 1470 

Qy 1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

II I I II II II I I I II I I M Mill II II I I I I II II I M II I I I I I Mill 

Db 1471 T GAC CAT GT TAT C CT CAAGG CAAAT GAGAC CTTTGCCTTTGT G GGCAAC GT GACGCACT A 1530 

Qy 1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I II II I I I I I I M II II I II II II I I I I I II II II I I I I M M I I II M I I 
Db 1531 CGCCCAGGTCTGGCTCT^ACATCTCCGCAGAGATCCGGAGCTTCCTGGAGCAGGGCAGGCT 1590 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

MIMI II I I I I II I I I II I II I I I II II II II II Mill I I I I I M M 
Db 1591 GCAGCAGCATCTGCACTGGCTGCAGCAGTACGTGGCTGACCTCCGGCTACACCCTGAAGC 1650 

Qy 1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I I M II II II II I I M I II II I II I II II III I I MM II II II II II I 

Db 1651 AATGAACCTGTCACTGGACGAGCTGCCCCCTGCTCTGCGCCTGGACTACTTTTCTCTGCC 1710 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

II Mill Mill II I I I I I II I I II M I I II I II II Mill II I I II I I 



Db 


1711 


Qy 


1741 


Db 


1771 


Qy 


1801 


Db 


1831 


Qy 


1861 


Db 


1891 


Qy 


1921 


Db 


1951 


Qy 


1981 


Db 


2011 


Qy 


2041 


Db 


2071 


Qy 


2101 


Db 


2131 


Qy 


2161 


Db 


2191 


Qy 


2221 


Db 


2251 


Qy 


2281 


Db 


2311 


Qy 


2341 


Db 


2371 


Qy 


2401 


Db 


2431 


Qy 


2461 


Db 


2491 


Qy 


2521 


Db 


2551 



1711 CAAT GG C AC AGC C CT T C T G C AG CAGCT AGAC ACAAT AGACAAT G CAGC CT GT G GCT G GAT 1770 



C C AGT T C AT GT C CAAGGT GAGC GT GGACAT CT T CAAGGG CT T C C C C GAC GAGGAGAG CAT 
I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I 
C C AGT T C AT GT C CAAGGT G AGT GT GGACAT CT T C AAGG G GT TT C C T GAT GAGGAGAG CAT 



1800 



1830 



T GT CAACT AC AC C C T CAAC C AGG C CT AC C AGGAC AAC GT CACT GT TT T T G C C AGT GT GAT 1860 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II M II I I II I I I I I I I I I 
C GT GAACT AC ACT C T CAAT CAG GC CT AC C AG GACAAT GT T ACAGT AT T T G C C AGC GT GAT 1890 

CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 

I II I I I I I I I I II II Mill I I II II II II I I I I I I I I 

T T T C CAG AC AC G GAAG GAT GGTTCCCTCCCCC C AC AT GT C CAT T AC AAG AT T C G C C AGAA 1950 

CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

III I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II I I I I I I I I II I I I I I I I I 
CTCAAGCTTCACCGAGAAAACCAACGAGATCCGTCGTGCTTACTGGCGTCCAGGGCCCAA 2 010 

TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2040 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
CACTGGTGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATAGAACG 2 070 

CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I 
TGCCATCATCAACACGTTTGTGGGGCACGACGTGGTCGAACCCGGCAACTACGTGCAGAT 2130 

GT T C C CCT AC CC CT GCT AC ACACGC GAT GACT T C CT GT T T GT CAT T GAGC AC AT GAT GC C 2160 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GTT C C CGT AC C C CT GCT AC AC C C GT GAC GACT T C CT GT T T GT CAT T GAGC AC AT GAT GC C 2190 



GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 
ACTGTGCATGGTGATCTCCTGGGTTTACTCTGTGGCCATGACCATACAGCACATCGTGGC 



2220 



2250 



2280 



G GAGAAGGAG CACC G GCT CAAG GAGGT GAT GAAGAC CAT G G G C CT GAACAAC G C GGT GCA 
I I I I I I | | I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I 
GGAGAAAGAGCAT CGGCTAAAGGAGGT GATGAAGAC GAT GGGCCT GAACAACGCCGT GCA 2310 

CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I II II 
CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 237 0 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2 400 

M I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 

CGCCATCCTCAAGTATGGCCAGGTCCTCATGCACAGCCACGTGCTCATCATATGGCTCTT 2430 



I M | I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II 



CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

MINIMI I I I I II I I I I I II I I I I I II I I M I I I I I I I I II II I I I I I I I I I I I 

TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 
CAT GTAC GT G G C GAT C C GAGAGGAGGT GGC G CAT G AT AAGAT CAC G G C CT T C GAGAAGT G 258 0 

I I M I I I I II Mill Mill II II II II M I II I I II M I II II I I I II I I 

CAT GT AT GT AGCAAT C C GT GAGGAAGT AGCC C AC GAT AAGAT CACT GC CT T C GAGAAGT G 2610 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



25 81 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 264 0 

III I II I I I I I I I I I I I I I II II I I I II I I I I I I I I I I I I I I I II I I I I I 
2611 CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 2 670 

2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

III I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
2671 T GAAGT GGCAG GT G'VGGG CAT C CAGT G GC AC AC GT T CAG C CAGT C CC C AGT GGAAG G GGA 2730 

2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I I I I I I I I 
2731 TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 2790 

27 61 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
27 91 ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2 850 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 88 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
2851 CTTCCCACTACAGAAGTCCTATTGGCTGGGCAGTGGGCGGACAGAGACCTGGGAGTGGAG 2 910 

2 8 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 94 0 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2911 CTGGCCATGGGCACACGCACCACGCCTCAGCGTTATGGAGGAGGACCAGGCCTGTGCCAT 2 970 

2941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3 000 

I I I I I I I I I I I III I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I II I I 
2971 GGAGAGCCGGCACTTCGAGGAGACTCGCGGTATGGAGGAGGAGCCCACCCACCTGCCTTT 3030 

3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
3031 G GT CGT CT GC GT GGACAAGCTC AC CAAG GT CT ATAAAAAT GACAAGAAG CT GGC C T T AAA 3090 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

III I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I I I I II 
3091 CAAACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I II II 
3151 TGGCAAGACCACTACCATGTCTATCCTGACTGGACTGTTCCCACCCACGTCGGGCTCAGC 3210 

3181 CACCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTGGGCAT 324 0 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
3211 CACT AT C TAT GGC CAC GAC AT C C GC AC AGAGAT GGAT GAGAT CCGT AAGAAC C T GGGC AT 3270 

32 41 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3271 GTGCCCACAGCACAACGTGCTCTTTGACCAGCTCACTGTGGAGGAACACCTCTGGTTCTA 3330 

3301 CT CAC GG CT CAAGAGC AT GGCT CAGGAG GAGAT C C GCAGAGAGAT GGACAAGAT GAT C GA 3360 

MINI I I I I I MINIM M I I I I II II II II I II I I I I I I I I I I I I I I I I I I I 
3331 C T CAC GC CT C AAAAG CAT G G CACAAGAGGAGAT C C GCAAAGAGAT GGACAAGAT GAT C GA 3390 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 342 0 

I I II I II II I I I I I I I II I I I M I I I II I I I I I I I M I MM II II I II I II 
3391 GGACCTGGAGCTCTCCAACAAGCGCCACTCGCTGGTACAGACGCTGTCTGGAGGCATGAA 3450 
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Qy 
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3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 348 0 

I I I I I I I I I II II I I I II I I I I I I I I I I I MINI I I I I I I Ml I M M 
3451 GCGCAAGCT T T CAGTAGC C AT T GC CT T C GT G G GT GGCT CT AGAGC C AT TAT CT T AGAT GA 3510 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I I II I I II I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I 
3511 GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 3570 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II 
3571 CAAGCCGGGTCGCACTATCCTCCTGTCCACCCATCACATGGATGAGGCCGACCTGCTGGG 3630 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 
3631 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3690 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I II 
3691 CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
3751 CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

III III I II I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I II I II I I I II 
3811 CTCAGAGATGCAAGTGTCCCAGTTCATCCGCAAGCATGTGGCTTCCTCCCTGCTGGTGTC 3870 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I II 
3871 AGACACGAGCACCGAGCTCTCCTACATCCTGCCCAGCGAGGCTGTCAAGAAAGGGGCCTT 3930 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I MINI I I I I I I I II I I I I I I I I II I I I I I II II 
3931 CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 

3961 G CT GAT GGACACGACC CT GGAGGAAGT GT T C CT CAAGGT GT C GGAGGAGGAT C AGT CG CT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II II I II I I II 
3991 GCT GAT GGAC ACAAC C CT G GAGGAG GT GT T C CTCAAGGT GT CT GAAGAAGAC C AGT CACT 4050 

4021 GGAGAACAGT GAGGCC GAT GT GAAGGAGT CCAGGAAGGATGT GCT CCCTGGGGCGGAGGG 408 0 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I Mill 
4051 GGAGAATAGTGAGGCCGATGTGAAGGAGTCCCGGAAGGATGCACTGCCTGGGGCAGAGGG 4110 

4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

II I II III MM II I I II I I I II II II I M II I II I II I I I I I I I I I I 
4111 CCTGAC GGCT GTGGAGAGTCAAGCAGGCAACCT GGCT CGGTGCTCAGAGCTGGCAC AGT C 417 0 

4141 GCAGGC AT C GCT GCAGT CGGC GT CAT CT GTGGGCT CT GCC C GT GGCGACGAGGGAGCT GG 4200 

I II I I II II I II II I II II I I II I II I I II I II I II I I II I II I I Mill 
4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 4230 

42 01 C T AC AC C GAC GT CT AT GGC GACT AC C G C C C C CT CT TT GAT AAC C C AC AGGAC C CAGACAA 4260 

I II II I I I I II III II II I I I I I I I I I I I I I I II I M I I I I I I I I I II I I I 
4231 CTACACCGACGGCTACGGTGACTACCGTCCCCTCTTTGACAACTTGCAGGACCCAGACAG 42 90 

42 61 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 
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I I I I I I I l I 1 1 I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

4291 TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

III M Ml I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I 
4351 GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

III II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4411 CTGTGCTCGCCGGAACTCCAAAGCGCTCT.GCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 447 0 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

III I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I 
4471 CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4530 

4501 C CT GT C AC CT T C C CAGT AC CACAAC T AC AC C CAGC C C C GT GG CAAT T T CAT C C C CT AC GC 4560 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
4531 CCTGTCGCCTTCTCAGTACCACAACTATACCCAGCCCCGTGGCAACTTTATCCCCTATGC 4590 

45 61 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 62 0 

III I I I I I I I I I I I I I I II I I I I I I I I I II II II I I I I I I I I I I I I I I I I 
4591 CAAT GAGGAAC GC C GC GAGT AC CGAT T AC GGCT GT C AC CT GAT GC CAGC C C C C AGCAGT T 4650 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 68 0 

I I I I I I I I I I I 1 I I I I I I I II II I I I I I I I I I I I II I II I I I I I I I I I I I II 
4 651 GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I II II I I I I I I I I I I I 
4711 CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 477 0 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

4771 ACGGTTCTTCGACAGTATGTGCCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAACTT 4830 

48 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA 4 857 

I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I 
4 831 CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 4890 

4858 CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4917 

I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I 

4 8 91 ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4 950 

4918 ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4 977 

II II I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I I I I I I II I I 
4951 GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

4978 CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
5011 GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 507 0 

5038 C GACAT C CT GAC C GACAT CAC C GGC C ACAAT GT CT CT GAGT ACCT GC T CTT C AC CT C C GA 5097 

I I I I I I I I II I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I II I I I II 
5071 G GACAT C C T GAC T GACAT CAC C GG C CACAAT GT TT C C GAGT ACCT G CT CTT C AC CT CT GA 5130 



5098 CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCC 
III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I I I I I I I 



5157 



5131 CCGTTTCC G AC T G C AC C G CT AT G GAG C CAT C AC C T T T G GT AAT AT C C AGAAGT C CAT C C C 5190 

5158 AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

Ml | I I | | I I I I I I I I I I I I II I I I I I I M I I II I I I I I I I I I I I 
5191 AGCACCCATTGGTACCCGGACCCCTCTCATGGTCCGGAAGATTGCAGTGCGGAGGGTGGC 5250 

5218 CCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAA 5277 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5251 CCAGGTGCTCTACAACAACAAGGGCTACCACAGCATGCCCACCTACCTCAACAGCCTCAA 5310 

527 8 CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II II II I I 1 I I II 
5311 CAATGCCATTCTGCGTGCT^AACCTACCCAAAAGCAAGGGCAATCCAGCAGCCTACGGTAT 5370 

5338 C AC C GT C AC C AAC C AC C C CAT GAAT AAGAC C AG CG C C AGCC T CT C CCT G GAT T AC CT G CT 5397 

I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M 
5371 C AC C GT C AC CAAC C AC C C CAT GAACAAGAC C AGT GC T AGC CT C T C CC T G GAT T AC CT ACT 5430 

5398 GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

I I I I I I I II Mill I I I I I I I I I I I I I I I I II I I I I I 

5431 GCAGGGCACAGACGTGGTCATCGCCATCTTCATCATTGTGGCCATGTCCTTCGTGCCGGC 5490 

5458 CAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGT 5517 

I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I II I II 
5491 CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 

5518 CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 5577 

I I I I I I I I MINIM II I I I I I I I I I I I I I I I II 

5551 CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 

5578 CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 5637 

I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I I I I Ml I I I I I I I I I II I I 
5611 CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 5670 

5638 GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

Ml | I I I I I I I I I I I I I II II MINI I I I I I I I I I I I I I I I I I I I I I I I I I I 
5671 GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 5730 

5698 GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 5757 

| | | | || I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I 
5731 ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 5790 

5758 CATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCT 5817 

III I I I M II I I I I I I I I I I I I I I I I I I II I I I I I I I I II I II I II I I 

57 91 CATCGTCATCAACCTCTTCATTGGCATCACGGCCACAGTGGCCACCTTCCTTCTGCAGCT 5850 

5818 CTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCAT 5877 
III I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 

58 51 C TT T GAGCAT GACAAGGAT C T GAAGGTT GT CAAC AGT T AC CT GAAAAGCT GCT T C CT C AT 5910 

5878 T TT CC C CAACT ACAAC CT G GG C CAC GGGCT CAT GGAGAT G G C CT AC AAC GAGT AC AT CAA 5937 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I 
5911 CT T CC CCAACT ACAAC CT GG GC CAC G GACT CAT G GAGAT AGC C T ACAAC GAAT AC AT CAA 5970 

5938 C GAGT ACT AC G C C AAGAT T GG C CAGT T T GACAAGAT GAAGT C C C C GT T C GAGT G GGAC AT 5997 

III I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I M I I I I I I 
5971 C GAAT ACT AT G C C AAGAT C GG C CAGT T T GACAAGAT GAAGT C C C C GT T T GAGT GGGAC AT 6030 
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Db 
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Db 


6691 




67 18 


Db 


6751 


Qy 
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TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 6057 

I I I I I I II I I I I I I I I II I I I I I I II I I I II I I I I I I II III I II I I I I I 
TGTCACACGTGGACTGGTGGCCATGACAGTCGAGGGCTTCGTGGGATTCTTTCTCACCAT 6090 

CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 6117 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I 
CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTAAACCTGT 6150 

G GAGGAT GAT GT GGACGT GGC CAGT GAGC GGC AGC GAGT G C T C C GGGGAGAC GC C GACAA 6177 

Ml II I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I II II II I I I I I 
GGAAGACGATGTAGACGTGGCCAGTGAGCGGCAAAGAGTGCTCCGTGGCGATGCTGACAA 6210 

T GACAT GGT CAAGAT T GAGAAC CT GAC CAAGGT CT AC AAGT C C C GGAAGAT T GGC C GT AT 6237 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
T GACAT G GT CAAGAT C GAGAAC CT GAC T AAG GT GT ACAAGT CT C GGAAGAT C GGC C GCAT 627 0 

CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 62 97 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I II 
CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 6330 

C GT CAAC GGT GC GGGCAAGAC CAGC AC CT T CAAGAT GCT GAC C GGC GAC GAGAG CAC GAC 6357 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II 
GGT CAAT GGT GC C GGGAAGAC CAGC AC CT TCAAGAT GT T GACT GGAGAT GAGAGCACAAC 6390 

GGGGGGCGAGGC CTT CGT CAAT GGAC ACAGCGT GCT GAAGGAGCT GCT C CAGGT GCAGCA 6417 

M I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 
AGGGG GC GAGGC CT T T GT CAAT GGAC AC AGT GT GCT CAAG GAC CT G CT C C AGGTT C AGCA 6450 

GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 647 7 

I I I I I I I I I I I I II I I I I I I I Mill I I I I I I I I I I I I I I I I I II II II II 
GAGCCTTGGCTACTGCCCACAGTTCGACGCCCTGTTCGATGAGCTCACGGCTCGCGAACA 6510 



CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 

I I I I I I I I I I I I II II I I I II II I I I I I 1 I I I I I I I I I I I I I I I I I II I I 
CCTGCAGCTGTATACTCGGCTTCGAGGCATCCCCTGGAAGGAT GAGGC GCAGGTGGTGAG 



6537 



6570 



6597 



GTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAG 

I I I I I I I I I I I I I I I I I I I I II I I I I MM I II II I I I I I I II II I II II II 
GTGGGCCCTGGAGAAGCTGGAGCTGACGAAGTGTGCAGACAAGCCAGCCGGTAGCTACAG 6630 

CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 6657 

II I I II II I I I I I II II Mill I I II I I II I I I II II II I M I I I I II II I I 
TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 6690 

CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 6717 

I M II I I II II II I II I I I I M M I II I II II I I I II I I I II I II M I I I I I I I I 
CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 6750 

CAT C CT C GAC CT CAT CAAGACAGGGC GT T CAGT GGT GCT GACAT CAC ACAGCAT GGAGGA 6777 

III II M I I II II II I I I II I I II I II I M I II II I II I I I II I I II II II I II II 

CAT T CT GGAC C T CAT C AAGAC AGGAC GT T CAGT GGT GCT GAC CT C AC AC AGCAT GGAGGA 6810 

GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 6837 

I I I I I I II II II II I I I I I I II M I I II II II I I I II II I I I II I I II M M 
ATGCGAGGCTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 6870 



Qy 6838 CAGCAT CCAGCAC CT GAAGAACCGGTT T GGAGAT GGCTACAT GAT CACGGT GCGGACCAA 6897 

I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
Db 6871 GAGT AT C CAGCACCT C AAGAACAGGTTT GGGGACGGCT ACAT GAT CACT GTAAGGACCAA 6930 

Qy 6898 GAG C AG C C AG AG T GT G AAG G AC GTGGTGCGGTTCTT C AAC C G C AAC T T C C C G G AAG C CAT 6957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 

Db 6931 AAG CAG C C AGAAC GT GAAGGAT GT GGT GCGGTTCTT C AAC C G GAACT T C C C AGAG GCC AT 6990 

Qy 6958 GCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCT 7017 

I 1 I I I I M I II I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6991 G CT CAAGGAAC GC C AC CAT AC GAAGGT GCAGT AT CAGCT CAAGT C G GAGCAC AT CT CGCT 7050 

Qy 7018 GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 7077 

Ml I I I I I I I I I I I I I I I I I I I I I I I Ml M M I I I I I I I I I I I I II I I I I I I 
Db 7051 GGCTCAGGTGTTCAGCAAGATGGAGCACGTGGTCGGTGTACTGGGCATCGAGGACTACTC 7110 

Qy 7078 GGT CAGCCAGACCACACT GGACAAT GT GTT CGT GAACTTT GC CAAGAAGCAGAGTGACAA 7137 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7111 AGT CAGCCAGACCACTCT GGATAACGT GTTT GT GAACTT C GCCAAGAAGCAAAGT GACAA 7170 

Qy 7138 CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 7197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 7171 T GT GGAGCAGCAAGAGGCT GA GCCATCCACCTTGCCGTCCCCCCTTG GACTACT 7224 

Qy 7198 CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 7257 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I 
Db 7225 TAGCCTGCTGCGGCCCCGCCCTGCACCCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 7284 

Qy 7258 CGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCT 7317 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 7285 TGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAAGAGCGGGCCCAGCT 7344 

Qy 7318 GTCCTT CAACACGGACACGCT CTGCTGAC CAC CCAGAGCT GGGCCAGGGAGGACACGCT C 7377 

I I I I I I I I I I I II I I I I I II I I I I I I I I M I I I I I I I I 
Db 7345 CT C CT T CAACAC C GAT AC GCT CT GCT GAC GT T CAAGAGT CAC AT CAG GGAT G 7396 

Qy 7378 CACT GAC CAC C C AGAG CT GGGC C AGGGACT CAACAAT GGGGAC AGAAGT C C C C CAGT GC C 7437 

I I I I I I I I I I I I I I I I 

Db 7397 CAGCTGTTTGGGGCAGAAGTCAGGCGGTGGCCGTAGCCCCAGTCACACA 7445 

Qy 7438 TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 7496 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I 
Db 7446 TGCCAGGCCCTGGAAAGGCAGGTTCAGGACCAAAGGGCTCCCGCCCTCC 7494 

Qy 7497 CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCG 7556 

III I I III I I I I II I I I I I I I I I II 

Db 7495 TCCCAACTACCATCCTCCCCGATCGTGCCAAAGGCTGGGCTG 7536 

Qy 7557 GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I 
Db 7537 GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGTCCTGGCCCAGC 7596 

Qy 7616 CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 7673 

M I I I I I I I II I I I I II I I I I I I I I I I I I I I I II I I I 

Db 7597 CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 7 656 

Qy 7674 GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 7733 



Db 


7657 


TGTGACCCTTCTCTGCAGCGGCCACCAGTCTACCCAGGCCAGCATCTTGCACAGATGTCT 


7716 


Qy 


7734 


GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 

< ■■■ i ■ ■ i i ■ III 1 1 1 L 1 1 1 1 1 1 1 1 1 1 1 1 III 

I II 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II M II 1 

TTCATGAAAAGACTGCAGTTGGGGAGGTGGCAGCTTGCCTACTTATTTTGCTTTAAGA— 


7792 


Db 


7717 


7774 


Qy 


7793 


AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 
• ■• ■ ■ ii ii i i i ii i i i i i i i i i i i 

1 1 1 1 III II 11 11 1 1 III 1 1 1 1 1 1 1 M 1 1 

GCCTCCCTCACTCTGCTGTTGTGAAGAAGTTAGGCTACCATGGGAAGCCATGAATG 


7852 


Db 


7775 


7830 


Qy 


7853 


TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 

i i ■ i ■ ■ i ■ ■ i i i i i i i i i i tii 

Ml || | I 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGCTAGGTG 


7905 


Db 


7831 


7890 


Qy 

Db 


7906 
7891 


AGGGGCCA GACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 

, iii i ii i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 


7960 
7949 


Ov 


7961 


CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 

| | | | I I 1 1 1 || II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 
-CCCTTCCTGCCACCCATGTGGGAGTAGGACCTTGTATATAGCACACAGATGTTTGTTTT 


8020 


Db 


7950 


8008 


Qy 


8021 


AAAT AAAT AAAC AAAAT G 8038 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 
CAATAAATAAGCAAAAAG 8026 




Db 


8009 
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BD140903 8040 bp DNA linear PAT 18-SEP-2002 

Human and rat ABCA2 gene. 

BD140903 

BD140 903.1 GI: 23235 848 
WO 0208424-A/4. 
Rattus sp. 
Rattus sp. 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 

1 (bases 1 to 8040) 
Inagaki, N. 

Human and rat ABCA2 gene 

Patent: WO 0208424-A 4 31-JAN-2002; 

BANYU PHARMACEUTICAL CO LTD, NOBUYA INAGAKI 

OS Rattus sp. (rat) 

PN WO 0208424-A/4 

PD 31-JAN-2002 

PF 26-JUL-2001 WO 2001JP006457 
PR 26-JUL-2000 JP OOP 225462 
PI NOBUYA INAGAKI 
PC 

Cl2N15/12,C07K14/47 / Cl2Nl/15,C12Nl/19,C12Nl/21 / C12N5/00, G01N33/ PC 
68, 

PC G01N33/15,G01N33/50 

CC Human and rat ABCA2 gene 

FH Key Location/Qualif iers 



FT source 1. .8040 

FX /organism= ' Rattus sp. (rat) 1 . 

FEATURES Location/Qualifiers 
source 1. .8040 

/organism="Rattus sp." 
/mol_type=" genomic DNA" 
/db_xref= n taxon: 10118" 

ORIGIN 

Query Match 72.3%; Score 5810; DB 6; Length 8040; 

Best Local Similarity 84.0%; Pred. No. 0; 

Matches 6768; Conservative 0; Mismatches 1205; Indels 85; Gaps 15; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

|| | | | | | I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I II 

Db 34 CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 93 

Q y 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

Ml M I I I I I I M I I II I I II I M M I I I I M I I I II M I I I I I 

D b 94 GCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGGAGCCCGTGGGTCCTGGCGTTTGAGAT 153 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I I I I I I I I I I I I I I M 

Db 154 CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 213 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

| M | | | | I I II I I I I I I I I I I I II II M I I I I I II I I I I I I II I I I I I I 
Db 214 CTCTGTGAAGGAAG CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

| I I I M I I I I I I I I I I I M II I I I I I I I I M I I I I I I I I I I I I I I I I I I I II 
Db 271 TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 330 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I || II I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I 

Db 331 CAACTCCACGGTCACCCAGCTTCTGGAACGCCTCAACCGTGTAGTGGAAGAGAGCAACTT 390 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

| I I I M I I I I I III II I I I I I I I I I M I I I I I I I I I I I M I III I I I I I I I 
Db 391 GT T T GAC CCAGAGC GACCT AGC CT GGGCT C AGAGCT T GAGG CACT GC AC CAAC GT CT GGA 450 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 

MINIMI I I I I I I I I I I II M I I I I I I II I I I I I I I I I I I I M 

Db 451 GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 510 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 

I II II I II I I I I I I I I I I I Ml II I I I I I I I I I M I I 

Db 511 CTTCTCTCTGGACTCGGTGGCCAGGGACAAAAGAGAGCTTTGGCGTTTCCTGATGCAGAA 570 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I II I I II I I II I I I I I I II I I I I I I II I I I I I I I I M 

Db 571 CCTGTCACTGCCCAACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I II I I I I I I II I M I I I I I I I I M I I I I I I II I I I I I 

Db 631 GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 690 



Qy 


661 


Db 


691 


Qy 


721 


Db 


751 


Qy 


781 


Db 


811 


Qy 


841 


Db 


871 


Qy 


901 


Db 


931 


Qy 


961 


Db 


991 


Qy 


1021 


Db 


1051 


Qy 


1081 


Db 


1111 


Qy 


1141 


Db 


1171 


Qy 


1201 


Db 


1231 


Qy 


1261 


Db 


1291 


Qy 


1321 


Db 


1351 


Qy 


1381 


Db 


1411 


Qy 


1441 


Db 


1471 


Qy 


1501 



1 1 1 1 1 1 1 II 1 1 1 1 1 I III II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 II 



GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 80 

I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 
GCTGGCTCCTGCCCTTTTGGAGCAACTCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 810 

GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 

Ml II II I I II I I I I MM III M M I I II I I I I I I I I I I I M I I I I I M 

GAT T CT T ACC AT G C CT GAGGGT CAT C AGGT AGAC CT T C AGG GCT AC CG GGAT GCT GT CT G 870 

CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I M I I I M I I II I I M I I I II II I I I I I I I II I I I I I 
CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 930 

CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

M I II I I I I I I II I I I I I II II I I I I II M I I I III I I I I I I II I I I I II 

C CAGCT GGAC AT AGC CAAGATT GC C C AGC AG CT G GGCT T CAAT GT C CC CAAC G GC T CAGA 990 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I M I I I M I I I II M II I II I II I I I M I I I I I I II I I I II I I II 
TCCACAGCCGCAGGCACCGTCCCCACAGAGTCTGCAGGCACTCTTAGGGGACCTGCTGGA 1050 

TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

II I I I I I I I I I I I I II I II I I I I I I I I M I I II II I II I I I I I I I I II I I I II 
TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 1110 

GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

II I I I I I I II II I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I 
AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 1170 

TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I M I I I II I I I I I II I I II II II I I I I I I I I I I I I I I M 
CAGCACCGGGGTAGGGGCAAATACAGGTCCCAACACCACCGTTGAGGAGGGCACCCAGTC 1230 

TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

I I I || I I I I I II II II I I I I I I I II II I I I II II II I II I I I I I I I 
ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 1290 

CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I I II I I III I II I I I II I II M M I I I I II I M I I I I I I M I I II II II II M 
CTGGGCTGGCTTG CAGC C CAT CTT GT GT G G CAACAACC GT ACCAT T GAGC C T GAAGC ACT 1350 

GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

Ml I II II II II II I I I I I II II II M III II II I II I I II I M I I II 

CCGGAGGGGCAACATGAGCTCACTGGGCTTTACGAGCAAAGAACAACGGAACCTGGGCCT 1410 

CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1 4.4 0 

II I M I II I II II M M M II II II II M I I I II I M II II II I I I II I II I 
TCTTGTGCACCTCATGACCAGCAACCCCAAAATCCTGTATGCACCCGCAGGCTCTGAAGC 1470 

CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

II I I II I II I I II II II II II I II I I I I I M II II I I I I I II II II I II I I 
TGACCATGTTATCCTCAAGGCAAATGAGACCTTTGCCTTTGTGGGCAACGTGACGCACTA 1530 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 



Db 


1531 


Qy 


1561 


Db 


1591 


Qy 


1621 


Db 


1651 


Qy 


1681 


Db 


1711 


Qy 


1741 


Db 


1771 


Qy 


1801 


Db 


1831 


Qy 


1861 


Db 


1891 


Qy 


1921 


Db 


1951 


Qy 


1981 


Db 


2011 


Qy 


2041 


Db 


2071 


Qy 


2101 


Db 


2131 


Qy 


2161 


Db 


2191 


Qy 


2221 


Db 


2251 


Qy 


2281 


Db 


2311 


Qy 


2341 



1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 

CGCCCAGGTCTGGCTCAACATCTCCGCAGAGATCCGGAGCTTCCTGGAGCAGGGCAGGCT 1590 

GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

| | I I I I II I I I I I I I I I I I I II I I I II II II II II I I I I I I I I I I M M 
GCAGCAGCATCTGCACTGGCTGCAGCAGTACGTGGCTGACCTCCGGCTACACCCTGAAGC 1650 

ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I | | I I I I I I I I I II I I I I I I I I I I I II II Ml I I I I I I I I I I M I I I I I 
AATGAACCTGTCACTGGACGAGCTGCCCCCTGCTCTGCGCCTGGACTACTTTTCTCTGCC 1710 

CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

|| I I I I I I II I I I I I I I I I I I I I II II II I I I I I M I I I I I I I I I I M I 

CAAT GGCAC AG CCCTTCTG CAGCAG CT AGAC ACAAT AGACAAT GC AGC CT GT GG C T GGAT 1770 

C C AGT T CAT GT C CAAGGT GAGC GT GGACAT CT T CAAGGGCT T CC C C GAC GAGGAGAGC AT 1800 
I M I I I I I I I I I II I I I I II I I I I II I I I I I I I I I I I I II M M II I I I I I I I I I 
C C AGT T CAT GT C CAAGGT GAGT GT GGACAT CT T CAAG GG GT T T C CT GAT GAGGAGAGCAT 1830 

TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 1860 

|| I I I I I I II Mill II I I I I II II I I II II I II II M M M M I I I I I I I 
C GT GAACT AC ACT CT CAAT C AGGC CT AC C AG GACAAT GT T ACAGT AT TT GC C AGC GT GAT 1890 

CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

II || I || I M I II II I M II I II I I II II II II II II I I I I I II M M I 
T T T C C AG AC AC G GAAG GAT GGTTCCCTCCCCC C AC AT GT C CAT T AC AAG AT T C G C C AG AA 1950 

CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

|| I I || I II II II II II II I I I I I I I M I I II II II I II II I II II I I II I I I I 

CT CAAGCTT C AC C GAGAAAAC CAAC GAGAT C C GT CGT GCT TACT G G C GT C CAGGG C C CAA 2010 

TACT GGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCT GGAT CCAGGACAT GAT GGAGCG 2 04 0 

II II I I II I II II II II I I I I I I II M I I II I I I II II I I I II I M I 

CACTGGTGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATAGAACG 2070 

CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I M M I II I MM II II II II M I II I I II II I II II II II II II I II II II I 
T GC CAT CAT CAAC AC GT T T GT G GGGCAC GAC GT GGT C GAAC C C G GCAACT AC GT GCAGAT 2130 

GT T C C C CT ACC C CT GCT AC AC AC G CGAT GACT T C CT GT T T GT CATT GAGC AC AT GAT GC C 2160 

M I II I II I II I II II II I I M M I I I II II I II II II II II M II II I II I I I M 

GTTCCCGTACCCCTGCTACACCCGTGACGACTTCCTGTTTGTCATTGAGCACATGATGCC 219 0 

GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

|| || II I M II II I II I I I II II II I I I II II I I I II II I I I II II II I M II I II 
ACTGTGCATGGTGATCTCCTGGGTTTACTCTGTGGCCATGACCATACAGCACATCGTGGC 225 0 

GGAGAAGGAGC AC C GG CT CAAG GAGGT GAT GAAGAC C AT GG G C CT GAAC AAC GC GGT GC A 2280 

MUM Mill Mill I I I I I I I M II II I II I I I M II II II II II II I II I II 

GGAGAAAGAGCAT C GGCT AAAG GAGGT GAT GAAGAC GAT GGGC CT GAACAAC GC CGT GC A 2310 

CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I || || I M II I I II M M I II I M I II II II I II I II II II II II II I II I II II II 
CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 237 0 

C GC C AT C CT GAAGT AC GG C C AG GT GC T TAT G C AC AGC C AC GT G GT C AT CAT CTGGCTCTT 2400 

I M I II I II II II I I I II II II II II I I I II II II II M II I II I I II II I II I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2371 C G C CAT C CT CAAGT AT GGC CAG GT C CT CAT G C ACAGC C AC GT G CT CAT CAT AT GG C T C T T 2430 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

III II I I I I I II I I I II I II I I I I I I I I II I I I II I I I i I I I I I I I I I I I I I I I I 
2431 CCTTGCTGTCTATGCTGTGGCCACTATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2490 

2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
24 91 TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 

2521 CAT GTACGT GGCGAT CCGAGAGGAGGT GGCGCAT GATAAGAT CACGGC CTT C GAGAAGTG 2580 

I I I I I I II II I I I I I I I I I I II II II I I II I I I I I I I I I I I I I I I I I I I I I 
2551 CAT GT AT GT AG CAAT C C GT GAGGAAGTAGC C CAC GATAAGAT CACT G C CT T C GAGAAGT G 2610 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2640 

III II I I I I I I I I I I I I I I II I I I I I II I I I I I M I I I I I I I I II I I I I I 
2 611 CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 2670 

2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

III I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
2671 TGAAGTGGCAGGTGTGGGCATCCAGTGGCACACGTTCAGCCAGTCCCCAGTGGAAGGGGA 2730 

27 01 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I II I 
2731 TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 2790 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

2791 ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2 850 

2821 CTT CC CACT GCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 8 8 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
2851 CTTCCCACTACAGAAGTCCTATTGGCTGGGCAGTGGGCGGACAGAGACCTGGGAGTGGAG 2910 

28 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2940 

I I I I I I I I I I I I I I I I I I II I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2911 CTGGCCATGGGCACACGCACCACGCCTCAGCGTTATGGAGGAGGACCAGGCCTGTGCCAT 2970 

2941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I II I I I I I I I I III I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2971 G GAGAG C C GGC ACT T C GAGGAGACT C G C GGT AT G GAG GAG GAGC C CAC CC AC CT G C CT T T 3030 

3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

III I I I I I II I I I I I I I I II I I I I I I I I I I I II I I I I I I II I I I II I I I I II 
3031 GGTCGTCTGCGTGGACAAGCTCACCAAGGTCTATAAAAATGACAAGAAGCTGGCCTTAAA 3090 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

III II I I I I I I II I I I I I I II I I I I I I I I I I I I I I I III I I II I I I I I I I I I I 
3091 CAAACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I II II II 
3151 T GGCAAGAC CACT AC CAT GT C TAT C C T GACT G GAC T GT T C C CAC C CAC GT C G G GCT C AGC 3210 

3181 CAC CAT CT AC G GGCAC GAC AT CC G CAC GGAGAT G GAT GAGAT C C G C AAGAAC CT G GGC AT 3240 

II I I I II I II I I I I II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I 
3211 CAC TAT CT AT GGC CAC GAC AT C C GC ACAGAGAT GGAT GAGAT C C GT AAGAAC CT GG GC AT 3270 



3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

| | | | M | M | I | 1 I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
3271 GTGCCCACAGCACAACGTGCTCTTTGACCAGCTCACTGTGGAGGAACACCTCTGGTTCTA 3330 

3301 CT C ACGGCT CAAGAGC AT GG CT C AG GAGGAGAT C C GC AGAGAGAT G G AC AAGAT GAT C G A 3360 

| | | | | | | | | M I I II I I II II I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I 
3331 CTCACGCCT CAAAAGCATGGCACAAGAGGAGAT CCGCAAAGAGATGGACAAGATGATCGA 3390 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

| | | | I I I I I I I I I I I I I I I I I II Mill Mill I I II I I I I I II I I I I I I I I 
3391 GGACCTGGAGCTCTCCAACAAGCGCCACTCGCTGGTACAGACGCTGTCTGGAGGCATGAA 3450 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 348 0 

| | | | || I M II II Mill I I I I I I I I I I I MIMI I Mill III I I I M 
3451 GCGCAAGCTTTCAGTAGCCATTGCCTTCGTGGGTGGCTCTAGAGCCATTATCTTAGATGA 3510 

3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

| | | I I I II M II I I I I I M M II I I I I I M M I I I I I II I M I I II II 

3511 GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 357 0 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

MIMI II Mill Mill I II I II I I I M I I I I I I I I I I I I I I II 

3571 CAAGCCGGGTCGCACTATCCTCCTGTCCACCCATCACATGGATGAGGCCGACCTGCTGGG 3630 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

|| | | | | | | | I I I I I I I II II I II I I I I I I I I I M I I II I I I I I II I I M I I I M I II 
3631 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3690 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

| | | | I I MM I I I I I II M I I II M II I II I II I I II M I II II II I II M 

3691 CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 
3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I || M II II I I I I II MM I I II I I II I M I I I II I I II I I M I I Ml 

3751 CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 
3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I Ml I II M II II I I II II M I I I II II I I MM I I M I II M II 

3811 CTCAGAGATGCAAGTGTCCCAGTTCATCCGCAAGCATGTGGCTTCCTCCCTGCTGGTGTC 3870 
3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I | | I I | | || I I I II I M I II M I II I I II I I II I II I II I I I II I I I M M M 

3871 AGACACGAGCACCGAGCTCTCCTACATCCTGCCCAGCGAGGCTGTCAAGAAAGGGGCCTT 3930 
3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

M II II I II II I Mill I I I II I II I I I M II II M I II I II I I I II M M 

3931 CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 
3961 GCT GAT GGAC ACGACC CT GGAGGAAGT GT T CCT CAAG GT GT C GGAGGAGGAT C AGT C G CT 4020 

|| M I I I M I I I I II I II I I I I I II II I I II I I I II M I I M II II II I M II 

3991 GCT GAT GGAC ACAAC C CT GGAGGAGGT GT T C CT CAAG GT GT CT GAAGAAGAC C AGT C ACT 4050 

4 021 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4080 

| | | | | | II II I II I I M MIMI II I II I I II M I I II I I I I I M I I 

4051 GGAGAATAGTGAGGCCGATGTGAAGGAGTCCCGGAAGGATGCACTGCCTGGGGCAGAGGG 4110 
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4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

II I II III I I I I I I I I II I II I I I I I I I I I M I I I I I I I I I I I I I I II 
4111 CCTGACGGCTGTGGAGAGTCAAGCAGGCAACCTGGCTCGGTGCTCAGAGCTGGCACAGTC 4170 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

II I II II II I I I I I I II I I I II I I I I I II I II I I I I I I II I I I II I I I I I 
4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 4230 

4201 CTAC ACC GAC GT C TAT GG C GACTAC CGCCCCCTCTTT GAT AAC CC ACAG GAC C C AGAC AA 4260 

I I I I I I I I I I I III II I I I I I I I I I I I I I II I I I I III I I II I I I I I I I I I 
4231 CTACACC GAC G G C T AC GGT GACTAC CGTCCCCTCTTT GACAACTT GC AG GACC CAGAC AG 42 90 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
4291 TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

III II III I I I I I I I I I I I MM I II II II I I I I I I Mill II I I II I I II 
4351 GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4 44 0 

Ml II I II I I I I I I I I I I II I I I I I I I II II II I I I I I II I I I II II I I I I 
4411 CTGTGCTCGCCGGAACTCCAAAGCGCTCTGCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 4470 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

III I I I I II M I II I I I II MM I II II I II II II M I II I II II I I I I I 
4471 CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4530 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

MUM I II II II II II II I M I I I I II II II II II I II M I II I I I II M I II 

4531 CCTGTCGCCTTCTCAGTACCACAACTATACCCAGCCCCGTGGCAACTTTATCCCCTATGC 4 59 0 
4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 462 0 

Ml I I I II I II II I II I II I II I I I II I II M II I M I I I M M I II II I 

4591 CAAT GAGGAAC G C C GC GAGT AC CGAT T AC GGCT GT C AC CT GAT GC CAGC CC C CAGC AGT T 4650 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 468 0 

M I I II II I I I II I I I I I I II II I I M I I I II II II I I I I I I I I II I II I II 
4 651 GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

M I I II I I I II M I II I I I I Mill II I M II II I I I I I II I I I I I I I I I II 
4711 CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 4770 

4741 TCGGTTCTTC GACAG CAT GT GT CT GGAGT C CT T C AC AC AGGG GCT GC CACT GT C CAAT T T 4 800 

M I M I I II I I II I II I II M II I I I II I II I II II II I I I II II II I I I II I I II 
4771 ACGGTTCTTCGACAGTATGTGCCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAACTT 4830 

4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA 4 857 

II I I II II I I I I II II M I I II I I I I I II Mill M I I II I II I I I II I I I 

4 831 CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 4 8 90 

4858 CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4917 

I II I II I I I I I I II I I I I II II II I II M II I I I I II I II I I I I I I 

4 8 91 ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4950 

4918 ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4977 
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|| M I I I I I I I I I I I M I MMI I I I II I I I I I I I I I MINIM 

GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 

| | | | | | | | | M I I I II I M II I I I I I I I I I II I I I I I I I II I I II I II I M M 
GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 5070 

CGACATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGA 5097 

I I I I I I II I I I II I I I I II I I I I I I I M II I I I I II I I II I II II 

GGACAT C C T GACT GAC AT C ACC GG C CAC AAT GT T T C CGAGT AC CTGCTCTT C AC CT CT GA 5130 

CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCC 5157 

Ml Ml I M I I I I I M M I I M I I M I Ill I I I II I I M II I 

C C GT TT C C GACT G CAC C GCT AT GGAGC C AT C AC CT T T G GTAAT AT C C AGAAGT C CAT C C C 5190 

AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

Ml I II M M I I I I I M I I I I II I I I I M I I I I I I I I I I I I I I M 
AGCACCCATTGGTACCCGGACCCCTCTCATGGTCCGGAAGATTGCAGTGCGGAGGGTGGC 5250 

CCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAA 5277 

| I I M I II I I I M I I I I II M I I M I M I I I M II I II I II 

C CAG GT GCT C T ACAACAACAAGGGCT AC CAC AG CAT G C C CAC CT ACCT CAAC AGC CT CAA 5310 

CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

Ml Mill II I I I I I II I I M II II II I I I II M 

CAATGCCATTCTGCGTGCAAACCTACCCAAAAGCAAGGGCAATCCAGCAGCCTACGGTAT 537 0 

CACC GT CAC CAAC CACC CC AT GAATAAGAC C AGC GC C AGC CT CT C CCT GGAT T AC CT G C T 5397 

Ml I II II II II II II II I II II M I I II II II I I I II II I II I M M I M 

CAC C GT CAC CAAC CAC C C CAT GAACAAGAC C AGT G CT AGC CT CT C C CT GGAT T AC CT ACT 54 30 
GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

|| | | M II I M II II I II I M I II II I I I II I I I I II I M I I I M II I I II I I I M 

GC AGG GCACAGAC GT GGT CAT C GC CAT CT T CAT CAT T GT GGC CAT GT CCTT C GT GC CGGC 5490 
CAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGT 5517 

M I II I I I M II M I I I I I I I M II M I II II I II M I I I I I I II 

CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 
CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 5577 

MUM II II M II I II II I I I M I II II I II I I I II I I I II I I I M II I M II 

CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 
CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 5637 

| | | M II I I II I I I I I M I M II I M M I II I I I I I III II I I II I I I I I I I 

CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 5670 
GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

Ml I II M II I M II M II M I II I I I I I M I I I II M I I I I I I I II 

GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 5730 

GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 5757 

II I I I II I M M I I M I I I I I M I I II I I I I I I I I I I I I M I II II II II I I I I I I 
ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 5790 

CATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCT 5817 
I II I II I II I I I I I I I I II I II I II II Mill I I II M II II II II M Mill 
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57 91 CATCGTCATCAACCTCTTCATTGGCATCACGGCCACAGTGGCCACCTTCCTTCTGCAGCT 5850 

5818 CTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCAT 5877 

111 I I I I I I I i I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
5851 CTTT GAGCAT GACAAGGAT CT GAAGGTT GTCAACAGTT AC CT GAAAAGCT GCTT CCTCAT 5910 

5878 TTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAA 5937 

I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
5911 CT T C C C CAACT ACAAC CT GGGC C AC G GAC T CAT GGAGAT AGC CT ACAAC GAAT AC AT CAA 5970 

5938 C GAGTACT AC GC CAAGAT T GGC CAGT T T GACAAGAT GAAGT C C C C GT T C GAGT G GGAC AT 5997 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5971 C GAATACTAT GC CAAGAT CGGC CAGT TT GACAAGAT GAAGTCCC CGTTT GAGT GGGACAT 6030 

5998 TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 6057 

MINI II I I I I I I I I I I I I I I I I II I I I I I I I I II I I I III I II I I I I I 
6031 T GT CACAC GT GGACT GGT GGCC AT G AC AGT C GAGGG CT T C GT GG G AT T C T T T CT C AC CAT 6090 

6058 CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 6117 

I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
6091 CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTAAACCTGT 6150 

6118 GGAGGAT GAT GT G GAC GT GGC CAGT GAGC GGCAGC GAGT GCT C C G GGGAGAC GC CGACAA 6177 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II II I I I 
6151 GGAAGAC GAT GT AGAC GT GGC CAGT GAGC GGCAAAG AGT GCT C C GT G GC GAT GCT GAC AA 6210 

6178 T GACAT GGTCAAGATTGAGAACCT GACCAAGGT CTACAAGTCCCGGAAGATT GGCCGT AT 6237 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
6211 T GACAT GGT CAAGAT CGAGAACCT GACTAAGGT GTACAAGTCT CGGPVAGAT CGGCCGCAT 6270 



6238 



6297 



CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II 
6271 CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 6330 

62 98 C GT CAACG GT GC GGGCAAGAC C AGC AC CT T CAAGAT GCT GAC C G GC GAC GAGAGCACGAC 6357 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II 
6331 GGT CAAT G GT GC C GGGAAGAC C AG CAC CT T CAAGAT GT T GACT GGAGAT GAGAGC ACAAC 6390 

6358 GGGGGGCGAGGCCTTCGT CAAT GGACACAGCGT GCT GAAGGAGCT GCT CCAGGTGCAGCA 6417 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I 
6391 AGGGGGCGAGGCCTTTGTCAATGGACACAGTGTGCTCAAGGACCTGCTCCAGGTTCAGCA 6450 

6418 GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 6477 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 
GAGCCTTGGCTACTGCCCACAGTTCGACGCCCTGTTCGATGAGCTCACGGCTCGCGAACA 6510 



6451 



6537 



64 78 CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 

I I I II I I I II I I II I I I I I II II III I I II I I I I I I I I I I I I I I I I I I I I 
CCTGCAGCTGTATACTCGGCTTCGAGGCATCCCCTGGAAGGATGAGGCGCAGGTGGTGAG 6570 



6511 



6538 GTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAG 6597 

MINI I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I II II I I I I I I I 

6571 GTGGGCCCTGGAGAAGCTGGAGCTGACGAAGTGTGCAGACAAGCCAGCCGGTAGCTACAG 6630 

6598 CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 6657 

II I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6631 TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 6690 



Qy 6658 CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 6717 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6691 CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 6750 

Qy 6718 CAT C C T C GAC CT CAT CAAGACAGG G C GT T CAGT GGT G C T GACAT CAC AC AGC AT G GAG GA 6777 

III II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6751 CATT CT GGACCT CAT CAAGACAGGACGTT CAGT GGT GCTGACCT CACACAGCAT GGAGGA 6810 

Qy 6778 GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 6837 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I II I I I I I 

Db 6811 ATGCGAGGCTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 6870 

Qy 6838 C AG CAT C CAG C AC CT GAAGAAC C G GT T T G GAGAT GGCT AC AT GAT C ACG GT GC GGACCAA 6897 

I I I I I I I I I I I I I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6871 GAGTAT CCAGCACCT CAAGAACAGGTTT GGGGACGGCT ACAT GAT C ACT GTAAGGACCAA 6930 

Qy 6898 GAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCAT 6957 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I 

Db 6931 AAGC AGCCAGAAC GT GAAG GAT GT GGT GC GGT T CTT CAAC C G GAACT T C C C AGAGG CC AT 6990 

Qy 6958 G CT C AAGGAG C GG CACC AC AC AAAGGT G C AGTAC CAGC T CAAGT C GGAGCAC AT CT CG CT 7 017 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 6991 GCT CAAGGAACGCCACCATAC GAAGGT GCAGTATCAGCT CAAGT C GGAGCAC AT CT CGCT 7 050 

Qy 7 018 GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 7 077 

Ml I | I I I I I I I I I I I I I I I I I I I I I III II II I I I I I I I I I I I I I I I I I I I I 

Db 7 051 GGCTCAGGTGTTCAGCAAGATGGAGCACGTGGTCGGTGTACTGGGCATCGAGGACTACTC 7110 

Qy 707 8 GGT CAG C CAGAC CACACT G GAC AAT GT GTT C GT GAACT T T GC CAAGAAG C AGAGT GACAA 7137 

I I I II I I I I I II I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 7111 AGT CAGCCAGAC CACT CT GGATAACGT GTTT GT GAACT T C GC CAAGAAGCAAAGT GACAA 7170 

Qy 7138 CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 7197 

I I I I I I II I I I I I I I I I I I I I I I I II Ill I III 

Db 7171 T GT GGAGCAG CAAGAGG CT GA GCCATCCACCTTGCCGTCCCCCCTTG GACTACT 7224 

Qy 7198 CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 7257 

I I I I I I I I I I I I I I I I I I I I Mill I I I I I I I I I I I I I I I I I I I II I M I I 

Db 7225 TAGCCTGCTGCGGCCCCGCCCTGCACCCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 7284 

•Qy 7258 CGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCT 7317 

I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 72 85 T GAGGAC CT G GAC AC GGAGGAC GAGGGC CT CAT C AG CT T C GAGGAAGAGCGG G C C CAGCT 7344 

Qy 7318 GT C CT T CAACAC GGACACG CT C T GCT GAC CAC C CAGAG C T GGGC CAG GGAGGACAC GCT C 7377 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7345 CT C CT T CAACAC C GAT AC GCT CT G CT GAC GT T CAAGAGT C ACAT CAG GGAT G 7396 

Qy 737 8 CACT GAC CAC CCAGAGCT GGGC CAGGGACT CAACAATGGGGACAGAAGT CCCC CAGTGCC 7437 

II I II II I I I I I I II I 

Db 7397 CAGCTGTTTGGGGCAGAAGTCAGGCGGTGGCCGTAGCCCCAGTCACACA 7445 

Qy 7438 TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 74 96 

I I I I 1 I 1 I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 

Db 7446 TGCCAGGCCCTGGAAAGGCAGGTTCAGGACCAAAGGGCTCCCGCCCTCC 74 94 



Qy 7497 CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCG 7556 

III I I III I I I I I I I I I I I I I I I II 

Db 7495 T C C CAACT ACC AT C CT C C C CGAT C GT GC CAAAGGCT GGGC T G 7536 

Qy 7557 GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7 615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7537 GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGTCCTGGCCCAGC 7596 

Qy 7616 CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 7673 

II I I I II I I I I I I I I II I I I I I I I I I I I II I III I I I 

Db 7597 CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 7 656 

Qy 7674 GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 7733 

I I I I I I I I I I I I I I I III I II II I 

Db 7657 T GT GAC CC T T C T CT GCAG C GG C C AC C AGT CT AC C C AG GC CAGC AT CT T GC AC AGAT GT CT 7716 

Qy 7734 GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 7792 

I II I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 
Db 7717 TTCATGAAAAGACTGCAGTTGGGGAGGTGGCAGCTTGCCTACTTATTTTGCTTTAAGA — 7774 

Qy 7793 AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 7852 

I I I I III II II I I I I III I I I I I I I I I I I 

Db 7775 G C CT C C CT C ACT CT GCT GT T GT GAAGAAGT T AG GCT AC CAT GG GAAG C CAT GAAT G 7830 

Qy 7853 TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 7905 

III II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 7 831 TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGCTAGGTG 78 90 

Qy 7906 AGGGGCCA GACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 7960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7891 AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 7949 

Qy 7961 CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 8020 

I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 7950 -CCCTTCCTGC CAC C CAT GT GGGAGT AGGAC CT T GT AT AT AGCACACAGAT GTTTGTTTT 8008 

Qy 8021 AAAT AAAT AAACAAAAT G 8038 

I I I I I I I I I I I I I I I 
Db 8009 C AAT AAAT AAG C AAAAAG 8026 
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AB037937 8040 bp mRNA linear ROD 12-OCT-2000 

Rattus norvegicus mRNA for ABC2 , complete cds . 

AB037937 

AB037937.1 GI:10799948 
ABC2. 

Rattus norvegicus (Norway rat) 
Rattus norvegicus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; 
Rattus . 
1 (sites) 

Zhao,L.X., Zhou, C. J., Tanaka,A., Nakata,M., Hirabayashi, T . , 
Amachi,T., Shioda,S., Ueda,K. and Inagaki,N. 

Cloning, characterization and tissue distribution of the rat 



ATP-binding cassette (ABC) transporter ABC2/ABCA2 
JOURNAL Biochem. J. 350 Pt 3, 865-872 (2000) 
MEDLINE 20427713 
PUBMED 10970803 
REFERENCE 2 (bases 1 to 8040) 
AUTHORS Inagaki,N. 
TITLE Direct Submission 

JOURNAL Submitted ( 03-FEB-2000 ) Nobuya Inagaki, Akita University School of 
Medicine, Department of Physiology; Hondo 1-1-1, Akita, Akita 
010-8543, Japan (E-mail : inagaki @med. akita-u . ac . jp, 
Tel: +81-18-8 84-6060, Fax:+81-18-884-6442) 
FEATURES Location/Qualifiers 
source 1. .8040 

/organism="Rattus norvegicus" 
/mol_type= n mRNA" 
/db__xref="taxon: 10116" 
/tissue_type="brain" 
gene 1- .8040 

/gene="abc2" 
CDS 68. .7372 

/gene="abc2" 
/codon_start=l 
/products "ABC2" 
/protein_id="BAB16596.1" 
/db_xref="GI: 10799949" 

/translation="MGFLHQLQLLLWKNVTLKRRSPWVXAFEIFIPLVLFFILLGLRQ 
KKPTISVKEAFYTAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLNRV 
VEESNLFDPERPSLGSELEALHQRLEALSSGPGTWESHSARPAVSSFSLDSVARDKRE 
LWRFLMQNLSLPNSTAQALLAARVDPSEVYRLLFGPLPDLDGKLGFLRKQEPWSHLGS 
NPLFQMEELLLAPALLEQLTCAPGSGELGRILTMPEGHQVDLQGYRDAVCSGQATARA 
QHFSDLATELRNQLDIAKIAQQLGFNVPNGSDPQPQAPSPQSLQALLGDLLDVQKVLQ 
DVDVLSALALLLPQGACAGRAPAPQAGSPSGPANSTGVGANTGPNTTVEEGTQSPVTP 
ASPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLV 
HLMTSNPKILYAPAGSEADHVILKANETFAFVGNVTHYAQVWLNISAEIRSFLEQGRL 
QQHLHWLQQYVADLRLHPEAMNLSLDELPPALRLDYFSLPNGTALLQQLDTIDNAACG 
WIQFMSKVSVDIFKGFPDEESIWYTLNQAYQDNVTVFASVI FQTRKDGSLPPHVHYK 
I RQNS S FTEKTNEI RRAYWRPGPNTGGRFYFLYGFVWIQDMI ERAI INTFVGHDWEP 
GNWQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKT 
MG LNN AVHWVAWF I T G FVQ LSI S VT ALT AI L K YGQ VLMH S H VL 1 1 WL FLAVYAVAT I M 
FCFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASLMSTT 
AFGLGSKYFALYEVAGVGIQWHTFSQSPVFIGDDFNLLLAVTMLMVDTWYGVLTWYIE 
AVHPGMYGLPRPWYFPLQKSYWLGSGRTETWEWSWPWAHAPRLSVMEEDQACAMESRH 
FEETRGMEEEPTHLPLWCVDKLTKVYKNDKKLALNKLSLNLYENQWSFLGHNGAGK 
TTTMSILTGLFPPTSGSATIYGHDIRTEMDEIRKNLGMCPQHNVLFDQLTVEEHLWFY 
SRLKSMAQEEIRKEMDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIIL 
DEPTAGVDPYARRAI WDLI LKYKPGRTI LLSTHHMDEADLLGDRIAI I SHGKLKCCGS 
PLFLKGAYGDGYRLTLVKRPAEPGTSQEPGMASSPSGRPQLSNCSEMQVSQFIRKHVA 
SSLLVSDTSTELSYILPSEAVKKGAFERLFQQLEHSLDALHLSSFGLMDTTLEEVFLK 
VSEEDQSLENSEADVKESRKDALPGAEGLTAVESQAGNLARCSELAQSQASLQSASSV 
GSARGDEGAGYTDGYGDYRPLFDNLQDPDSVSLQEAEMEALARVGQGSRKLEGWWLKM 
RQFHGLLVKRFHCARRNSKALCSQILLPAFFVCVAMTVALSVPEIGDLPPLVLSPSQY 
HNYTQPRGNFIPYANEERREYRLRLSPDASPQQLVSTFRLPSGVGATCVLKSPANGSL 
GPMLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPLSPDEDSLL 
AWNTSLPPTAGPETWTWAPSLPRLVHEPVRCTCSAQGTGFSCPSSVGGHPPQMRWTG 
D I LT D I T GHNVS E YLL FT S D RFRLHRYGAI T FGN I Q KS I PAP I GT RT P LMVRKI AVRR 
VAQVLYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSL 
DYLLQGTDWIAIFIIVAMSFVPASFWFLVAEKSTKAKHLQFVSGCNPVIYWLANYV 



WDMLNYLVPATCCIIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEV 
PSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKWNSYLKSCFLIFPNYNLGHGL 
MEIAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMTVEGFVGFFLTIMCQYNFLR 
QPQRLPVSTKPVEDDVDVAS ERQRVLRGDADND^T\/^<I ENLTKVYKSRKI GRI LAVDRL 
CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKDLLQVQQSLGY 
CPQFDALFDELTAREHLQLYTRLRGIPWKDEAQWRWALEKLELTKCADKPAGSYSGG 
NKRKLSTAIALIGYPAFIFLDEPTTGMDPKARRFLWNLILDLIKTGRSWLTSHSMEE 
CEAVCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQNVKDWRFFNRNFPE 
AMLKERHHTKVQYQLKSEHISLAQVFSKMEHWGVLGIEDYSVSQTTLDNVFVNFAKK 
QSDNVEQQEAEPSTLPSPLGLLSLLRPRPAPTELRALVADEPEDLDTEDEGLISFEEE 
RAQLSFNTDTLC" 

ORIGIN 

Query Match 72.3%; Score 5810; DB 10; Length 8040; 

Best Local Similarity 84.0%; Pred. No. 0; 

Matches 6768; Conservative 0; Mismatches 1205; Indels 85; Gaps 15; 

CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 93 

GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

I I I I I I I I I I I I II I I II I I I I I I II I I I I I 1 I I I I I I I I I I I I I I I I I M I I I I I 
GCT GCT CT GGAAGAACGT GACGCT GAAGC GCCGGAGC C CGT GGGT C CT GGC GTTT GAGAT 153 

CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 180 

I I M I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 213 

CTGCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I II I II I I I I II I I I II 
CT CT GT GAAGGAAG CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

T GT CAT GC AAT C GCT GT GC C C GGACGGC C AGCGAGAC GAGTT C GGCT T C CT GC AGT AC GC 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I M M I I I M I I I I I I I I I I I I I I M 
TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 330 

CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
CAACTCCACGGTCACCCAGCTTCTGGAACGCCTCAACCGTGTAGTGGAAGAGAGCAACTT 390 

GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I II I Ml I M I II I 
GTTTGACCCAGAGCGACCTAGCCTGGGCTCAGAGCTTGAGGCACTGCACCAACGTCTGGA 450 

GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 80 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 510 

CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 

I II I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I 

CTTCTCTCTGGACTCGGTGGCCAGGGACAAAAGAGAGCTTTGGCGTTTCCTGATGCAGAA 570 

CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I I I I I I I I I I I I I I I I I I I II III I I I I I I II I I I I I I I II I II 
CCTGTCACTGCCCAACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 



Qy 


1 


Db 


34 


Qy 


61 


Db 


94 


Qy 


121 


Db 


154 


Qy 


181 


Db 


214 


Qy 




Db 


271 


Qy 


301 


Db 


331 


Qy 


361 


Db 


391 


Qy 


421 


Db 


451 


Qy 


481 


Db 


511 


Qy 


541 


Db 


571 



Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I 
Db 631 GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 690 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I II I I I I I I I I III II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 691 GAAG C AG GAG C C CT G GAGT C AC C T G GGTAGCAAT C CT CT GT T C C AAAT G GAG GAGCT GC T 750 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

I I M I I I I I I I I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I I I I I I I 
Db 751 GCTGGCTCCTGCCCTTTTGGAGCAACTCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 810 

Qy 781 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

I M II II I I I I I I I I I I I I III || HI I II I I I I I I I I I I I I I I I I I I II 
Db 811 GATT CT T AC CAT G C CT GAGG GT CAT C AGGT AGAC CT T CAGG GCT AC C GGGAT GC T GT CT G 870 

Qy 841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I I I I I I I I I I I I II III II II I I I I I II I I I I I I I 
Db 871 CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 930 

Qy 901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I III I I I I II I I I I I I II 

Db 931 CCAGCTGGACATAGCCAAGATTGCCCAGCAGCTGGGCTTCAATGTCCCCAACGGCTCAGA 990 

Qy 961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 9 91 T C C ACAG C C G CAGGCAC C GT C C C CAC AGAGT CT GCAG GC AC T CT T AGGGGAC CT GC T GGA 1050 

Qy 1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 1051 TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 1110 

Qy 1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 1111 AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 1170 

Qy 1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I II 
Db 1171 CAGCACCGGGGTAGGGGCAAATACAGGTCCCAACACCACCGTTGAGGAGGGCACCCAGTC 1230 

Qy 12 01 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

Ml M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1231 ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 1290 

Qy 1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II II II II 
Db 1291 CTGGGCTGGCTTGCAGCCCATCTTGTGTGGCAACAACCGTACCATTGAGCCTGAAGCACT 1350 

Qy 1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 
Db 1351 CCGGAGGGGCAACAT GAGCT CACTGGGCTTT AC GAGCAAAGAACAACGGAACCTGGGCCT 1410 

Qy 1381 CCT CGT GCAC CT CAT GAC CAGCAACCC CAAAAT CCT GT AC GC GC CT GCGGGCT CT GAGGT 1440 

M II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II II II I I I I I I I I I 
Db 1411 TCTTGTGCACCTCATGACCAGCAACCCCAAAATCCTGTATGCACCCGCAGGCTCTGAAGC 1470 

Qy 1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 



Db 1471 TGACCATGTTATCCTCAAGGCAAATGAGACCTTTGCCTTTGTGGGCAACGTGACGCACTA 1530 

Qy 1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 1531 CGCCCAGGTCTGGCTCAACATCTCCGCAGAGATCCGGAGCTTCCTGGAGCAGGGCAGGCT 1590 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I II I I I I I I I I I I I I II I I I I I II II II II I I I I | | | | | | || II 
Db 1591 GCAGCAGCATCTGCACTGGCTGCAGCAGTACGTGGCTGACCTCCGGCTACACCCTGAAGC 1650 

Qy 1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I II I II I I I I I 

Db 1651 AATGAACCTGTCACTGGACGAGCTGCCCCCTGCTCTGCGCCTGGACTACTTTTCTCTGCC 1710 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

II I I I I I I I I I I I I M I I I I I I I II II II I I I I I I I | | | | | I I I I I I I I 

Db 1711 CAAT GGCACAGCCCTT CT GCAGCAGCTAGACACAAT AGACAAT GCAGCCT GT GGCTGGAT 177 0 

Qy 1741 C C AGT T CAT GT C C AAGGT GAG C GT GGACAT CT T CAAGGG CT T C C C C GACGAG GAGAGC AT 180 0 

I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I II II II I I I I I I I I II I 
Db 1771 C C AGT TC AT GT C CAAG GT GAGT GT GGACAT CT T CAAGGGGT TT CCT GAT GAGGAGAGC AT 1830 

Qy 1801 T GT CAACT ACAC CCT CAAC C AGGC CT AC C AG GAC AACGT C ACT GT T T T T GC C AGT GT GAT 1860 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I 

Db 1831 C GT GAACT ACACT CT CAAT C AGGC CT AC C AGGACAAT GT T ACAGT ATT T G CC AGC GT GAT 1890 

Qy 18 61 CT T C CAGAC C C GGAAG GAC G G CT C GCT CC C GCCT C AC GT GCACT ACAAGAT C C GC CAGAA 1920 

I I I I I I I I I I I I I I I I II II I I II I II II II II I I I I I I I I I I I I I I I I 
Db 18 91 T T T C CAGACAC GGAAG GAT GGTTCCCTCCCCC CAC AT GT C CAT T ACAAGAT T C GC CAGAA 1950 

Qy 1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II II I I I I I I I I 

Db 1951 CTCAAGCTTCACCGAGAAAACCAACGAGATCCGTCGTGCTTACTGGCGTCCAGGGCCCAA 2010 

Qy 1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
Db 2011 CACTGGTGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATAGAACG 2 070 

Qy 2041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
Db 2 071 TGCCATCATCAACACGTTTGTGGGGCACGACGTGGTCGAACCCGGCAACTACGTGCAGAT 2130 

Qy 2101 GT T C C CCT AC C C CT GCT ACACAC GC GAT GACTT C CT GT T T GT C ATT GAGCAC AT GAT G C C 2160 

I I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2131 GTTCCCGTACCCCTGCTACACCCGTGACGACTTCCTGTTTGTCATTGAGCACATGATGCC 2190 

Qy 2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 2191 ACT GT GC AT GGT GAT CT CC T GGGT TT ACT CT GT GGC C AT GACCAT ACAGC ACAT C GT G G C 2250 

Qy 2221 GGAGAAGGAGCACCGGCTCAAGGAGGT GATGAAGACCAT GGGCCT GAACAAC GCGGT GCA 22 80 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Mill 
Db 2251 GGAGAAAGAGCAT CGGCTAAAGGAGGT GAT GAAGACGAT GGGC CT GAACAACGCCGT GCA 2310 

Qy 2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II 



Db 


2311 


Qy 


2341 


Db 


2371 


Qy 


2401 


Db 


2431 


Qy 


2461 


Db 


2491 


Qy 


2521 


Db 


2551 


Qy 


2581 


Db 


2611 


Qy 


2641 


Db 


2671 


Qy 


2701 


Db 


2731 


Qy 


2761 


Db 


2791 


Qy 


2821 


Db 


2851 


Qy 


2881 


Db 


2911 


Qy 


2941 


Db 


2971 


Qy 


3001 


Db 


3031 


Qy 


3061 


Db 


3091 


Qy 


3121 


Db 


3151 



2311 CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 2370 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 
I I I I I M I I I I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I I I I I I I I 
CGCCATCCTCAAGTATGGCCAGGTCCTCATGCACAGCCACGTGCTCATCATATGGCTCTT 2430 

CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

I I I M Mill II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I 

CCTTGCTGTCTATGCTGTGGCCACTATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2490 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 

CAT GTAC GT G GC GAT C C GAGAGGAGGT GGC GCAT GATAAGAT C AC G GC CT T C GAGAAGT G 2580 

I I I I I I II M I I I I I INN M II I I I I I I I II I I I I I I I I I I I I I I I II I 

CAT GT AT GT AGCAAT C C GT GAG GAAGT AG C C CAC GATAAGAT C ACT GC CTT C GAGAAGT G 2610 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2640 
I I I I I I I I I I I I I II I I I I II I I I I I II I I I I I II I I I I II I I II I I I I I 
CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 267 0 

TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 
I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T GAAGT GG CAGGT GT GGGC AT C C AGT G GC ACAC GT T C AG C C AGT C C C C AGT G GAAGGG GA 2730 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

MINIMI NIMH II II I I II II II I I II I I I I I I I II II II I II I 

TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 2790 

CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

I I N I II M I I I I II I I I I I I I II II I II I I II II I II I I I I I I I I I II I I I I I I I 
ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2850 

CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2880 
I I I I I I N I I II II I I II II II I I || || I I II II I I I II II II I I II I II II I II I 
CT T C C C ACT ACAGAAGT C C TAT T GGCT GGG C AGT GGGC GGACAGAGAC CT GGGAGT GGAG 2910 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2940 
I M I M I II II II I I II II I I II M II I II I I M II II II M I I II I II II II 
CTGGCCATGGGCACACGCACCACGCCTCAGCGTTATGGAGGAGGACCAGGCCTGTGCCAT 2970 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 
I I I N II II II III I II II I M II II II I II II II I II I I I I I II II II I I I I I 
GGAGAGCCGGCACTTCGAGGAGACTCGCGGTATGGAGGAGGAGCCCACCCACCTGCCTTT 3030 

G GTT GT CT GC GT GGACAAACT CAC CAAGGT CTACAAG GAC GACAAGAAGCT G GC C CT GAA 3060 
I I I I I I I I I II I I II I I II II I II II I I I M II I I I I I II II II II I I I I II 
GGTCGTCTGCGTGGACAAGCT CAC CAAGGT CTATAAAAAT GACAAGAAGCT GGC CTTAAA 3090 

CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 
HI II I II I I I II I I I I I II I I I || M I I II I II II III I I II II II II I I II 
CAAACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 

GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I M M I I I II I I I II II II || || | | | | || | || | | | || || | | M II II II II 
TGGCAAGACCACTACCATGTCTATCCTGACTGGACTGTTCCCACCCACGTCGGGCTCAGC 3210 
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Db 

Qy 

Db 

Qy 

Db 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 



3181 C AC CAT CT AC GG G C AC GAC AT C C GCAC GGAGAT GGAT GAGAT C C G CAAGAAC CT G G G CAT 3240 

III I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3211 CACTATCT AT GGCCACGAC AT CCGCACAGAGAT GGAT GAGAT CCGTAAGAACCT GGGCAT 3270 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I 
3271 GTGCCCACAGCACAACGTGCTCTTTGACCAGCTCACTGTGGAGGAACACCTCTGGTTCTA 3330 

3301 CT CAC GGCT CAAGAG CAT GGCT CAGGAG GAGAT C C GC AGAGAGAT GGACAAGAT GAT C GA 3360 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
3331 CTCAC GCCT CAAAAGCAT GGCACAAGAGGAGAT CC GCAAAGAGAT GGACAAGAT GATCGA 33 90 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 342 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I II I I I I I I I I 
3391 GGACCTGGAGCTCTCCAACAAGCGCCACTCGCTGGTACAGACGCTGTCTGGAGGCATGAA 3450 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 8 0 

I I I I I I I I I II II I I I I I I I I I I I I I II I I I I I I I I I I I I I III I II II 
3451 GCGCAAGCTTTCAGTAGCCATTGCCTTCGTGGGTGGCTCTAGAGCCATTATCTTAGATGA 3510 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I I I I I I II I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I 
3511 GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 357 0 

3541 CAAGCCAGGCCGCAC CAT CCTTCTGTCCACCCACCACAT GGAT GAGGCTGACCTGCTTGG 3600 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
3571 CAAGCCGGGTCGCACTATCCTCCTGTCCACCCATCACATGGATGAGGCCGACCTGCTGGG 3630 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
3631 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3690 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
3691 CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 80 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I III 
3751 CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 384 0 

III II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3811 CTCAGAGATGCAAGTGTCCCAGTTCATCCGCAAGCATGTGGCTTCCTCCCTGCTGGTGTC 3870 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II 
3871 AGACACGAGCACCGAGCTCTCCTACATCCTGCCCAGCGAGGCTGTCAAGAAAGGGGCCTT 3930 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I II II I I I I I II II 
3931 CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 

3961 GCT GAT GGAC AC GAC C CT GGAG GAAGT GT T C CT CAAGGT GT CGGAGGAG GAT C AGT C GC T 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I II 
3991 GCT GAT G GACAC AAC C CT G GAG GAG GT GT T C C T CAAG GT GT CT GAAGAAGAC C AGT CACT 4050 



Qy 4021 GGAGAACAGT GAGGC CGAT GT GAAGGAGT C CAGGAAGGAT GT GCT CCCTGGGGC GGAGGG 4080 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | | I I 

Db 4 051 GGAGAAT AGT GAGGCC GAT GT GAAGGAGT CCCGGAAGGAT GCACT GCCTGGGGCAGAGGG 4110 

Qy 4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

II I II III I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I 

Db 4111 CCTGACGGCTGTGGAGAGTCAAGCAGGCAACCTGGCTCGGTGCTCAGAGCTGGCACAGTC 4170 

Qy 4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I I M I I I I I I I I II II I I I I I I I I I I I I I I I I II I II I I I I I I I I I I 
Db 4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 4230 

Qy 4201 CT ACACCGACGT CTAT GGC GACTACCGCCCCCTCTTTGATAAC CCACAGGACC CAGACAA 4260 

I I I I I I I I II I III II I I I I I I I I I I I I I I I I I I I IN I I I I I II I I I I I I 
Db 4231 CT AC AC C GAC GG CTAC GGT GAC T ACC GT CCCCTCTTT GACAACTT GC AGGAC C C AGAC AG 4290 

Qy 42 61 T GT CAGC CT GCAAGAGGT GGAGGCAGAGGCCCT GT C GAGGGT C GGCCAGGGCAGC C GCAA 432 0 

I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 42 91 TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

Qy 4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4 38 0 

III II Ml I I I I I II I I I I MM I I II II I I I I I II I II II II I I II I I I I 

Db 4351 GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

Qy 4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

III II I II I I I I I I I I I I II II I I I I I I I II II I II II I I I II I I I I I I II 
Db 4411 CTGTGCTCGCCGGAACTCCAAAGCGCTCTGCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 4470 

Qy 4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I II I I II II I II II II I I I II I I II I I I I I I I I II II I Mill II I I I I I 
Db 4471 CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4 53 0 

Qy • 4501 C C T GT C AC CT T C C CAGT AC CACAACT ACAC C C AGC C C C GT G GCAATT T CAT C C C CTAC G C 4560 

I II I II I II I I I II II II II I II I I I I II I II II I I II I I I I II II I I I II I M 
Db 4531 CCTGTCGCCTTCTCAGTACCACAACTATACCCAGCCCCGTGGCAACTTTATCCCCTATGC 4590 

Qy 4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 62 0 

Ml II II I I I I II I I I I I II I I I II I I I II II II I II I I I I I II I II I I I 
Db 4591 CAAT GAG GAAC G CC GC GAGT AC C GAT T AC GGCT GT C AC CT GAT GC CAGC C C C C AGCAGT T 4650 

Qy 4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 68 0 

I I II II I I I II I I M I I II II II II I I II M II I II I II I II I II I I II I II 
Db 4651 GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

Qy 4 681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

I II I I I I I I I I I I II I II I I I II I I I I I I II I II I I I II I I I II I I I I I I II 

Db 4711 CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 4770 

Qy 47 41 TCGGTTCTTC GACAG CAT GT GT CT GGAGT C CT T C ACACAG GGGC T GC CAC T GT CCAAT T T 4 800 

I I II I II II I II II I I II I I II I I I I I I I II I II I I II I II II I I I II II I I I I II 
Db 4771 ACGGTTCTTCGACAGTATGTGCCT GGAGT CCTTCACACAGGGGCTGCCACTGTCCAACTT 4830 

Qy 4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA 4857 

II M I I M I I I M I M M I I I I I II II II Mill II II I I I I M I I II I I I 

Db 4831 CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 4 890 

Qy 4858 CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4 917 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ill II I II 1 1 1 1 1 1 1 

48 91 ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4 950 

4918 ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4977 

|| || Mill I I I I I I I I I IMM I I I II I I I I I I I I I I I I I I I I I I I I I I 
4951 GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

4978 CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 

I I M I I I I I I I I I I I I I I I I I I I I I I I M I M I I I II 

5011 GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 5070 

5038 CGACAT C CT GAC C GAC AT C AC C GGC C AC AAT GT CT CT GAGT ACCT GCT C TT CACCT C CGA 5097 

| | I I I I I I II I I I I I I I I I I I Ml I II I I I I II II II 

5071 GGACATCCTGACTGACATCACCGGCCACAATGTTTCCGAGTACCTGCTCTTCACCTCTGA 5130 

5098 CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCC 5157 

| M I M II M II I I I M I M M Ml II I I I I I I I I M 

5131 C CGTT T C C GACT GCAC C G CT AT GGAGCC AT CAC CT T T G GT AAT AT C C AGAAGT CC AT C C C 5190 

5158 AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

Ml I | || I M I I I I I M I I I I I I I M I M M I I I II I M II II II 
5191 AGC AC C CAT T G GT AC C C GGAC C C CT C T CAT GGT C C GGAAGAT T GCAGT G CGGAGGGT GGC 5250 

5218 CCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAA 5277 

|| | || | || M I M II M I I I II I II M I I II I M I II I II II I I I 

5251 CCAGGT GCT CTACAACAACAAGGGCTACCACAGCAT GCCCACCT ACCT CAACAGCCTCAA 5310 

5278 CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

Ml Mill I II II M I Mill II I I I I I I II II I II I II M M I II I I II 

5311 CAAT GC CAT T CT GC GT GCAAAC CT AC C CAAAAG CAAGG G CAAT C CAGCAGC CT AC G GT AT 5370 
5338 C AC CGT CAC CAAC CAC C C CAT GAAT AAGAC C AGC G C C AG C CT CT C C CT GGAT T AC CT GCT 5397 

I M I II M II M I II II I I M II M II I II I M I M I M 

5371 CAC C GT CAC C AACC AC CC CAT GAACAAGAC CAGT G CT AGC CT CT C CCT G GATT AC CT ACT 5430 
5398 GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

|| | | || M I M II I II I I I I I M I I I I I I I I I I I M I I I M I I I II I I M II I I II 

5431 GCAGGGCACAGACGTGGTCATCGCCATCTTCATCATTGTGGCCATGTCCTTCGTGCCGGC 54 90 

5458 CAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGT 5517 

| | | | | | M I II II II I I I II M M I I I I I I II I II II II I II M II M I II I II 
54 91 CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 

5518 CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 5577 

MIMI M M II I I MMIIIIMIII II I I I I I I I I M I I M MM II 

5551 CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 
5578 CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 5637 

I | || I M II II I II II I II I II II II II I II MMI I I M II II I I I 

5611 CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 5670 

5638 GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

Ml II II I II II I I I I I M M M I M I I I I I I I M II II II I M II I M M II 
5671 GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 5730 

5698 GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 5757 

I I I 1 1 I I I I I i I 1 I I I I I I I I 1 I I I I I M I I MM MINIMI 



Db 



5731 ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 5790 



Qy 5758 CATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCT 5817 

III I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I | | I I 
Db 5791 CATCGTCATCAACCTCTTCATTGGCATCACGGCCACAGTGGCCACCTTCCTTCTGCAGCT 5850 

Qy 5818 CT T C GAGCAC GACAAGGAC C T GAAGGTT GT CAAC AGT T AC CT GAAAAGC T G CT T C CT C AT 5877 

III I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II I | I I 
Db 5851 CT T T GAG CAT GACAAGGAT CT GAAGGT T GT CAAC AGT T ACCT GAAAAGCT GCT T C CT CAT 5910 

Qy 5878 T TT C C C CAACT ACAAC CT GG GC CAC G GGCT C AT GGAGAT GGC CT ACAAC GAGT AC AT CAA 5937 

II I I I I I I I II I I I I I I I I I I I I I II I II II I II I I I I I I I I I I I I I I I I I I I I I I 
Db 5911 CT T C C C CAAC T ACAAC C T GGGC CACGGACT CAT GGAGAT AGC CT ACAAC GAAT AC AT CAA 5970 

Qy 5938 C GAGT ACT AC GC CAAGAT T GGC C AGT TT GACAAGAT GAAGT C C CC GTT C GAGT GG GAC AT 5997 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5971 C GAAT AC TAT G C CAAGAT C G GC C AGT TT GACAAGAT GAAGT C C C C GT T T GAGT GGGAC AT 6030 

Qy 5998 TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 6057 

I I I I II II I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I 
Db 6031 TGTCACACGTGGACTGGTGGCCATGACAGTCGAGGGCTTCGTGGGATTCTTTCTCACCAT 6090 

Qy 6058 CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 6117 

I I I I I I II II I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I II I I I I I 
Db 6091 CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTAAACCTGT 6150 

Qy 6118 GGAGGAT GAT GT GGACGT GGCCAGT GAGCGGCAGCGAGT GCT CCGGGGAGACGCCGACAA 6177 

Ml M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I 

Db 6151 GGAAGACGATGTAGACGTGGCCAGTGAGCGGCAAAGAGTGCTCCGTGGCGATGCTGACAA 6210 

Qy 6178 T GACAT G GT CAAGAT T GAGAAC CT GAC CAAG GT CTACAAGT C C C G GAAGAT T GGC C GT AT 6237 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6211 T GACAT GGT CAAGAT C GAGAACCT GACTAAGGT GTACAAGT CTCGGAAGAT C GGCCGCAT 6270 

Qy 6238 CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 6297 

II I I I I II I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I II 

Db 6271 CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 6330 

Qy 6298 C GT CAAC G GT G C GGGCAAGAC CAGC AC CTT CAAGAT GCT GAC C GGCGAC GAGAGC AC GAC 6357 

Mill I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I II 
Db 6331 GGT CAAT GGT G C C GGGAAGAC C AGCAC C TT CAAG AT GT T GACT GGAGAT GAGAGC ACAAC 6390 

Qy 6358 GGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCA 6417 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 6391 AGGGGGCGAGGCCTTTGTCAATGGACACAGTGTGCTCAAGGACCTGCTCCAGGTTCAGCA 6450 

Qy 6418 GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 6477 

I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I II II II 
Db 6451 GAGCCTTGGCTACTGCCCACAGTTCGACGCCCTGTTCGATGAGCTCACGGCTCGCGAACA 6510 

Qy 6478 CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 6537 

I I I I I I I I I I I I II I I I I I II II III I I I I II I I I I I I I I I I I I I I I I I I 
Db 6511 CCTGCAGCTGTATACTCGGCTTCGAGGCATCCCCTGGAAGGATGAGGCGCAGGTGGTGAG 657 0 

Qy 6538 GTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAG 6597 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 
Db 6571 GT GGGCC CT G GAGAAGCT GGAGCT GAC GAAGT GT G CAGACAAGC CAGC C G GT AGC T ACAG 6630 
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Qy 
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Qy 

Db 

Qy 
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Qy 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
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6598 CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 6657 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I 

6631 TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 6690 

6658 CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 6717 

III II I I I I I I I I I I I I I I I II I 1 I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

6691 CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 6750 

6718 CAT C C T C GAC CT CAT CAAGACAGGGC GT T CAGT GGT GCT GACAT CACACAGC AT G GAG GA 6777 

II I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I II I I I I I I I I I I 
6751 CAT T C T G GAC CT CAT CAAGAC AGGAC GT T CAGT GGTGCT GAC CT CAC ACAGCAT G GAG GA 6810 

6778 GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 6837 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I 
6811 ATGCGAGGCTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 6870 

6838 CAGCAT CCAGCACCT GAAGAACCGGTTT GGAGATGGCT ACATGAT CAC GGT GC GGACCAA 6897 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I II I I II II I 
6871 GAGT AT C CAG CAC CT CAAGAAC AGGT T T GGG GAC G GCT ACAT GAT CAC T GT AAG GAC CAA 6930 

6898 GAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCAT 6957 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I 

6931 AAGCAGCCAGAACGTGAAGGATGTGGTGCGGTTCTTCAACCGGAACTTCCCAGAGGCCAT 6990 

6958 GCT CAAGGAGCGGCACCACACAAAGGT GCAGT AC CAGCT CAAGT CGGAGCACAT CT C GCT 7017 

I I I I I I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

6991 GCT CAAG GAAC GC CAC CAT AC GAAGGT G CAGT AT CAGCT CAAGT C GGAGC ACAT CT C G CT 7050 

7018 GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 7077 

III I I I I I I I I I I I I I I II I I I I I I I I II II II I I I I I I I I I I I II I I I I I I I 
7051 GGCTCAGGTGTTCAGCAAGATGGAGCACGTGGTCGGTGTACTGGGCATCGAGGACTACTC 7110 

7078 GGT CAGC CAGACCACACT GGACAAT GTGTT CGT GAACTT T GCCAAGAAGCAGAGT GACAA 7137 

I I I I I I I I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

7111 AGT CAGC CAGACC ACT C T GGAT AAC GT GT T T GT GAACT T C GC C AAGAAGCAAAGT GACAA 7170 

7138 CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 7197 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

7171 T GT GGAGCAG CAAGAGG CT GA GCCATCCACCTTGCCGTCCCCCCTTG GACTACT 7224 

7198 CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 7257 

I I I I I I I I I i I I I I I I I I I I Mill II I I I I I I I I I I I I I I I I I II I I I I I 

7225 TAGCCTGCTGCGGCCCCGCCCTGCACCCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 7284 

7258 C GAGGAC CT G GAC AC GGAGGAC GAGGGC CT CAT C AGCT T C GAGGAGGAGC GGG C C CAGCT 7317 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7285 T GAGGAC CTGGACACGGAGGACGAGGGCCT CAT CAGCT TCGAGGAAGAGCGGGCC CAGCT 7344 

7318 GTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTC 7377 

I I I I I II I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 

7345 CT CCT T C AAC AC C GAT AC GCT C T GCT GAC GT T CAAGAGT CACAT CAGG GAT G 7396 

7378 CACT GAC CACC CAGAGCT GGGC CAGGGACT CAACAAT GGGGACAGAAGT C C C C CAGT GC C 7437 

III II II I Mill II I 

7397 CAGCT GTTTGGGGCAGAAGTCAGGCGGTGGCCGTAGCCC CAGT CACACA 7445 



Qy 7438 TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 7496 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 7446 TGCCAGGCCCTGGAAAGGCAGGTTCAGGACCAAAGGGCTCCCGCCCTCC 74 94 

Qy 7497 CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCG 7556 

III I I III I I I I I I I I I I I I I I I II 

Db 7495 TCCCAACTACCATCCTCCCCGATCGTGCCAAAGGCTGGGCTG 7536 

Qy 7557 GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I 
Db 7537 GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGTCCTGGCCCAGC 7596 

Qy 7 616 CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 7 673 

I I I I I I I I I I I I I I I I I I I I I I I I I I Mill I I I I I I 

Db 7597 CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 7656 

Qy 7674 GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 7733 

I I I I I I I I I I I I I I I III I II II I 

Db 7657 TGTGACCCTTCTCTGCAGCGGCCACCAGTCTACCCAGGCCAGCATCTTGCACAGATGTCT 7716 

Qy 7734 GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 7792 

I II I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7717 T T CAT GAAAAGACT G C AGT T G G GGAG GT G G C AG CT T GC CT AC T T AT TT T GCT T T AAGA — 7774 

Qy 7793 AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 7852 

I I I I III II II MM III I I I M M II I I 

Db 77 75 GCCTCCCTCACTCTGCTGTTGTGAAGAAGTTAGGCTACCATGGGAAGCCATGAATG 7830 

Qy 7853 TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 7905 

111 M I I I I I I M I I I I II I II I I I I II I I I I I I I 

Db 7831 TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGCTAGGTG 7 8 90 

Qy 7906 AGGGGCCA GACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 7960 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 7 8 91 AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 7 94 9 

Qy 7961 CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 802 0 

I I I I I I M I II II I I I I M I I I I I I II I I I M I I I I I I I I 

Db 7950 -CCCTTCCTGC C AC C CAT GT GG GAGT AGGAC CT T GTAT AT AGCAC ACAGAT GTTTGTTTT 800 8 

Qy 8021 AAAT AAAT AAACAAAAT G 8038 

I I II I I I I I I I I I I I 
Db 8 009 CAAT AAAT AAG C AAAAAG 8026 



RESULT 15 

MMABC2 

LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



REFERENCE 



MMABC2 7629 bp mRNA linear ROD 21-DEC-2000 

Mus musculus mRNA for ABC transporter (ABC2 gene) . 

X75927 

X75927.2 GI: 11990230 

ABC transporter; ABC2 gene; transmembrane protein. 
Mus musculus (house mouse) 
Mus musculus 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Rodentia; Sciurognathi ; Muridae; Murinae; Mus. 
1 



AUTHORS Luciani, M. F. , Denizot,F., Savary,S., Mattei,M.G. and Chimini, G. 
TITLE Cloning of two novel ABC transporters mapping on human chromosome 9 

JOURNAL Genomics 21 (1), 150-159 (1994) 
MEDLINE 94375008 
PUBMED 8088782 
REFERENCE 2 (bases 1 to 4744) 
AUTHORS Chimini, G. 
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JOURNAL Submitted ( 05-NOV-1993 ) G. Chimini, Centre d ' Immunologic de 
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REMARK revised by [3] 
REFERENCE 3 (bases 1 to 7629) 

AUTHORS Chimini , G . 
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FEATURES Location/Qualifiers 
source 1, .7629 

/organism="Mus musculus" 

/mol__type="mRNA" 

/strain="dba/2" 

/db_xref="taxon: 10090" 

/ chromosome=" 2 " 

/map="2A2-B" 

/cell_line="p388Dl" 

/cell_type="monocyte/macrophages" 
gene 1. .7629 

/gene="ABC2" 
CDS 1. .7305 

/gene="ABC2" 

/ codon_start=l 

/product="ABC transporter" 

/protein_id="CAA53531 . 2 " 

/db_xref="GI : 11990231" 

/db_xref="GOA:P41234" 

/db_xref="SWISS-PROT:P41234" 

/ trans la tion="MGFLHQLQLLLWKNVTLKRRSPWVLAFEIFIPLVLFFILLGLRQ 

KKPTISVKEAFYTAAPLTSAGILPVMQSLCPDGQRDEFGFLQYANSTVTQLLERLHRV 

VEEGNLFDPVRPSLGSELEALRQRLEALSSGPGTWESHSARPAVSSFSLDSVARDQRE 

LWRFLMQNLSLPNSTAQALLAARVDPSEVYRLLFGPLPDLDGKLGFLRKQEPWSRLGS 

NPLLQMEELLLAPALLEQLTCAPGSGELGRILTMPEGHQVDLQGYRDAVCSGQATARA 

QRFSDLAAELRNQLDTAKIAQQLGFDVPNGSDPQPQAPSPQSLPALLGDLLDAQKLLQ 

DVT>VLSALALLLPQGACAGQASAPQASSLNGLANSTGIGANSGSNTTVEEGTQSPVSP 

ASPDTLQGQCSAFVQLWAGLQPILCGNNRTIEPEALRRGNMSSLGFTSKEQRNLGLLV 

HmTSNPKILYAPVGSEADRVILKANETFAFVGNVTHYAQVWLNISTEIRSFLEQGRL 

QQHLQWLQQYVADLQLHPEAMNLSLEELPPALRQDFSLPNGTALLQQLDTIDNAACGW 

IQFMSKVSVDIFKGFPDEESIVNYTLNQAYQDNVTVFASVI FQTRKDGSLPPHVHYKI 

RQNS S FTEKTNEI RRAYWRPGPNTGGRFYFLYGLRLDQDMMERAI INTFVGHDWEPG 

NYVQMFPYPCYTRDDFLFVIEHMMPLCMVISWVYSVAMTIQHIVAEKEHRLKEVMKTM 

GLNNAVHWVAWFI T GFVQL S I S VTALT AI LKYCQVLMH S HVLI I WL FLAVYAVAT IMF 

CFLVSVLYSKAKLASACGGIIYFLSYVPYMYVAIREEVAHDKITAFEKCIASRCPQQP 

LAWPSTLHCMKWQEWASIQWHTFSQSPVEGDDFNLLLAWMLMV^TVAATG 

AVHPGMYGLPRPWYSRYRSPIGWAVGGQKPGSGAGHGHTHRASALWRRIQACAMESRH 

FEETRGMEEEPTHLPLWCVDKLTKVYKNDKKLALNKLSLNLYENQWSFLGHNGAGK 



TTTMS I LTGLFP PTS GSATI YGHDI RTEMDEI RKNLGMCPQHNVLFDRLTVEEHLWFY 
SRLKSMAQEEIRKETDKMIEDLELSNKRHSLVQTLSGGMKRKLSVAIAFVGGSRAIIL 
DEPTAGVDPYARRAIWDLILKYKPGRTILLSTHHMDEADLLGDRIAIISHGKLKCCGS 
PLFLKGAYXDGYRLTLVKQPAEPGTSQEPGLASSPSGCPRLSSCSEPQVSQFIRKHVA 
SSLLVSDTSTELSYILPSEAVKKGAFERLFQQLEHSLDALHLSSFGLMDTTLEEVFLK 
VSEEDQSLENS EADVKES RKDVL P GAEGLTAVGGQAGNLARCS ELAQS QAS LQS AS S V 
GSARGEEGTGYSDGYGDYRPLFDNLQDPDNVSLQEAEMEALAQVGQGSRKLEGWWLKM 
RQ FH G L L VK R FH C ARRN S KAL C S Q I L L P AFFVC VAMT VAL S VP E I GD L P P L VL S P S Q Y 
HNYTQPRGNFIPYANEERQEYRLRLSPDASPQQLVSTFRLPSGVGATCVLKS PANGS L 
GPMLNLSSGESRLLAARFFDSMCLESFTQGLPLSNFVPPPPSPAPSDSPVXPDEDSLQ 
AWNMSLPPTAGPETWTSAPSLPRLVHEPVRCTCSAQGTGFSCPSSVGGHPPQMRWTG 
DILTDITGHNVSEYLLFTSDRFRLHRYGAITFGNVQKSIPASFGARVPPMVRKIAVRR 
VAQVLYNNKGYHSMPTYLNSLNNAILRANLPKSKGNPAAYGITVTNHPMNKTSASLSL 
DYLLQGTDWIAI FI I VAMS FVPAS FWFLVAEKSTKAKHLQFVSGCNPVI YWLANYV 
WDMLNYLVPATCCVIILFVFDLPAYTSPTNFPAVLSLFLLYGWSITPIMYPASFWFEV 
PSSAYVFLIVINLFIGITATVATFLLQLFEHDKDLKWNSYLKSCFLIFPNYNLGHGL 
MEMAYNEYINEYYAKIGQFDKMKSPFEWDIVTRGLVAMTVEGFVGFFLTIMCQYNFLR 
QPQRLPVSTKPVEDDVDVASERQRVLRGDADNDMVKIENLTKVYKSRKIGRILAVDRL 
CLGVRPGECFGLLGVNGAGKTSTFKMLTGDESTTGGEAFVNGHSVLKDLLQVQQSLGY 
CPQFDALFDELTAREHLQLYTRLRGIPWKDEAQWKWALEKLELTKYADKPAGTYSGG 

NKRKLSTAIALI gypafi fldepttgmdpkarrflwnli ldli ktgrs wlt SHSMEE 

CEALCTRLAIMVNGRLRCLGSIQHLKNRFGDGYMITVRTKSSQNVKDWRFFNRNFPE 

AMLKERHHTKVQYQLKSEHISLAQVFSKMEQWGVLGIEDYSVSQTTLDNVFVNFAKK 

QSDNVEQQEAEPSSLPSPLGLLSLLRPRPAPTELRALVADEPEDLDTEDEGLISFEEE 

RAQLSFNTDTLC" 
exon 1. .66 

/gene="ABC2" 

/ number=l 
exon 67. .160 

/gene="ABC2" 

/ number=2 
exon 161. .272 

/gene="ABC2" 

/number=3 
exon 273. .436 

/gene="ABC2" 

/ number =4 
exon 437. .564 

/gene="ABC2" 

/ number =5 
exon 565. .675 

/gene="ABC2" 

/ number =6 
exon 676. .894 

/gene="ABC2" 

/ number=7 
exon 895. .1262 

/gene="ABC2" 

/ number =8 
exon 1263. .1422 

/gene="ABC2" 

/ number =9 
exon 1423. .1550 

/gene="ABC2" 

/number=10 
exon 1551. .1716 

/gene= ,, ABC2 M 



/number=ll 

exon 1717. .1813 

/gene="ABC2" 
/number =12 

exon 1814. .1987 

/gene="ABC2" 
/number =13 

exon 1988. .2090 

/gene="ABC2" 
/ number=14 

exon 2091. .2205 

/gene="ABC2" 
/ number =15 

exon 2206. .2396 

/gene="ABC2" 
/number=16 

exon 2397. .2547 

/gene="ABC2 " 
/ number=17 

exon 2548. .2755 

/gene="ABC2 " 
/number =18 

exon 2756. .2920 

/gene="ABC2" 
/number=19 

exon 2921. .3101 

/gene="ABC2" 
/number=2 0 

exon 3102. .3314 

/gene="ABC2" 
/ number =2 1 

exon 3315. .3511 

/gene="ABC2 M 
/ number =2 2 

exon 3512. .3694 

/gene="ABC2" 
/ number =2 3 

exon 3695. .3879 

/gene="ABC2" 
/ number =2 4 

exon 3880. .4000 

/gene="ABC2 " 
/number =2 5 

exon 4001. .4237 

/gene= n ABC2" 
/number =2 6 

exon 4238. .4444 

/gene="ABC2" 
/ number =2 7 

exon 4445. .4547 

/gene="ABC2 " 
/number =2 8 

exon 4548. .4867 

/gene="ABC2" 
/ number =2 9 

exon 4868. .5081 

/gene="ABC2" 



exon 



exon 



exon 



exon 



exon 



exon 



/number=30 
5082. .5187 
/gene= n ABC2" 
/ number =31 
5188. .5299 
/gene="ABC2 M 
/number =3 2 
5300. .5360 
/gene= M ABC2" 
/ number =3 3 
5361. .5535 
/gene="ABC2 " 
/ number =3 4 
5536. .5651 
/gene="ABC2" 
/ number =3 5 
5652. .5799 
/gene= M ABC2" 
/ number=36 



Query Match 7 0.1%; 

Best Local Similarity 84.7%; 
Matches 6493; Conservative 



Score 5636.2; DB 10; Length 7629 
Pred. No. 0; 
4; Mismatches 1099; Indels 



71; Gaps 13; 



Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



35 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
1 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGG 60 

95 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 

I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II II II I I I I I I I I I I I M 

61 AGCCCGTGGGTCCTGGCTTTTGAGATCTTCATCCCGCTTGTCCTCTTCTTCATCCTGTTG 12 0 

155 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCG 214 

II I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II M 

121 GGACT G C GGCAGAAGAAG CC GAC CAT CT CT GT GAAGGAAG CTTTCTACACCGCAGCA 177 



215 



178 



275 



238 



335 



298 



395 



358 



455 



418 



CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

II INN II I I I I I I I I I I I I I I I I I I I I I I I I I II Mill II I I I I I I! I 

CCGCTGACATCAGCCGGCATCCTGCCCGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGT 237 

GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill M II I I I I I 

GATGAGTTTGGCTTCCTGCAATATGCCAACTCCACGGTCACCCAGCTTCTGGAACGCCTC 297 



GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 

MM M I M I I II I Mill I I II I I II II I III II I I I I M I I I I I I I I I I 

CACCGTGTAGTGGAGGAGGGCAATTTGTTCGACCCAGTGCGACCCAGCCTGGGCTCAGAG 



394 



357 



454 



CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 

I II M I M II I I I I I I II II I I I M II M I I I II II I II II I M II I II 

CTCGAGGCTCTGCGCCAACGTCTGGAGGCCCTCAGCTCAGGCCCTGGCACCTGGGAGAGT 417 

CAC CT GGACAGAT C CACAGT GT CT TCCTTCTCTCT GGACT CGGTGGCCAGAAACCCGC AG 514 

III I II I I I II I I II I I II I I II I I II I II II I I I II II I I III I 
CACTCAGCCAGACCTGCAGTTTCATCCTTCTCTCTGGACTCGGTGGCCAGGGACCAGAGA 477 



Qy 



515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 57 4 
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Qy 
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Qy 

Db 

Qy 

Db 
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Db 

Qy 

Db 
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Db 
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575 
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635 



598 



695 



658 



755 



718 



815 



778 



875 



838 



935 



898 



995 



958 



II I I I I I I I I I I I I I I I I III III I I I I I I I I I I I I I I I I I I I I I I I I I I III 
GAGCTTTGGCGTTTCCTGATGCAGAACCTGTCACTGCCCAACAGCACGGCCCAAGCCCTC 

TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I III I 
CTAGCTGCCCGTGTGGACCCTTCCGAGGTCTATCGCTTGCTTTTTGGTCCTTTGCCTGAC 



537 



634 



597 



694 



CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 

I I I I I I I I I I II III II I I I I I I I II I I I I II I I I I I I I I I I I I 

CT G GAT GGAAAGT T G GGT T T C CT T AG GAAG C AG GAG C C CT GGAGC C G CCT GG GT AGCAAT 657 

CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 754 

II III III I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I II 
CCTCTGCTCCAAATGGAGGAGCTGCTGCTGGCTCCTGCCCTTTTGGAACAGCTCACATGT 717 

ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTCCAGGTTCTGGGGAACTGGGCCGGATTCTTACCATGCCTGAGGGTCATCAGGTAGAC 777 

CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 87 4 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
CTTCAGGGCTACCGGGATGCTGTGTGCAGTGGGCAGGCTACAGCTCGTGCCCAGCGCTTC 837 

TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 934 

I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
AGCGATTTGGCCGCTGAGCTCAGGAACCAGCTGGACACAGCCAAGATTGCTCAGCAGCTG 897 

GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 994 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I I I I 

GGC T T C GAT GT C C CCAAC G G CT CAGAT C C C C AGC CAC AGGCAC C GT C CC C ACAGAG CCT G 957 

CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

I III II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCGGCACTCTTAGGGGACCTGCTGGATGCCCAGAAACTTCTGCAGGATGTGGATGTCCTA 1017 



1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I III I I 
1018 TCAGCCCTTGCCCTGCTGCTGCCTCAAGGTGCCTGTGCTGGCCAGGCCTCTGCACCTCAA 1077 

1115 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1174 

I I I I I I I III I I I I I I I I I I I I I I I I I I I II I I I I I 
1078 GCCAGCAGCCTGAATGGCCTGGCCAACAGCACCGGGATAGGTGCAAATTCAGGTTCCAAC 1137 

1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1234 

I I I I I I I I I II I I I I I I II Ml I I I I I II II I I I I I I I I 

1138 ACCACTGTTGAGGAGGGCACCCAGTCACCTGTCAGCCCAGCCTCTCCTGACACTCTGCAA 1197 

1235 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1294 

II I I I I I I I I I I I I I I II I I I I I II I I I I III I I I I I I I I I I I I I I I I I I I I I I 
1198 GGGCAGTGCTCAGCCTTTGTGCAGCTCTGGGCTGGCTTGCAACCCATCTTGTGTGGCAAC 1257 

12 95 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

I I I I I I I I I I I II II II I I I I I III I I I I II I I II I I I I I I II I I I M II 
1258 AACCGCACCATCGAGCCTGAAGCGCTTCGGAGAGGCAACATGAGCTCCCTGGGTTTTACA 1317 

1355 AGCAAGGAGC AGC GGAACC T GGGC CTCCTCGTG CAC CT CAT GAC C AG CAAC CC CAAAAT C 1414 
I I II I I I I I I I I I II I I I I II I II II I I I II I I I I I I I I I I II I I I I I I I I I I II I 
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Db 
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Db 
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Db 


1735 
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Db 
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Db 
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Qy 
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Db 


1915 


Qy 


2015 


Db 


1975 


Qy 


2075 


Db 


2035 


Qy 


2135 


Db 


2095 


Qy 


2195 


Db 


2155 



AGCAAGGAACAG C GGAACT TGGGCCTTC T AGT GC AC CT CAT GAC CAGCAAC C C CAAAAT C 1377 

CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1474 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I III 
CTGTACGCACCAGTGGGCTCTGAAGCGGACCGCGTTATCCTCAAGGCAAATGAGACCTTT 1437 

GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

M I I I I I I I I I I I II I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCTTTGTGGGCAACGTTACACACTACGCCCAGGTCTGGCTCAACATCTCCACAGAGATC 1497 

CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I Ml I I I I I 

CGAAGCTTCTTGGAGCAAGGCAGGCTGCAGCAGCATCTGCAGTGGTTACAGCAGTATGTA 1557 

GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

I I III I I I I I II III I I I I I I I I II I I I I I I I I I I I I I II II 

GCTGATCTTCAGCTACACCCTGAAGCAATGAACCTGTCCCTGGAGGAGCTGCCACCTGCT 1617 

CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

Ml I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I II M 
CTGCGCCAGG ACTTCTCACTGCCTAATGGCACAGCCCTCCTGCAACAGCTTGACACA 1674 

ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 1774 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

AT AGACAAC GC AGC CT GT G GCT GGAT CC AGT T CAT GT C CAAG GT GAGT GT GGACAT CTT C 1734 

AAGG G CT T C C C C GAC GAG GAGAGCAT T GT CAACT ACAC C CT CAAC CAGG CCT ACC AGGAC 1834 

I I I I I II II I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I 
AAGGGATTT CCT GAT GAGGAGAGCAT CGTGAACTACACT CT CAAT CAGGCCT ACCAGGAC 1794 

AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 94 

II I I I I I II II I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I Mill II 
AATGTCACAGTGTTTGCCAGCGTGATCTTCCAGACACGGAAGGACGGCTCCCTCCCTCCA 18 54 

CACGTGCACTACAAGATCCGCCAGAACT CCAGCTTCACC GAGAAAAC CAACGAGATCC GC 1954 

II || II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 

CAT GT ACAT TACAAGATT C GC CAGAATT CAAG CT T C ACT GAGAAAAC CAAT GAGAT C C GC 1914 

CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2014 

I I II II I I I II II I I I I I I I I II M M I I I I I I I I I I I I I I I I I M I 
CGTGCTTATTGGCGTCCAGGGCCCAACACCGGTGGTCGCTTCTACTTCCTCTATGGGCTT 1974 

GT C T GGAT C CAGGACAT GAT GGAGC G CG C CAT CAT C GAC AC T T T T GT GG GG CACGAC GT G 2074 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C GT CT GGAC CAGGACAT GAT GGAGCGC GC C AT CAT CAACACAT T T GT GGGGC ATGAC GT G 2034 

GT GGAGC CAGGC AG CT AC GT GCAGAT GT T C C C CT AC C C C T GCT ACAC AC GC GAT GACTT C 2134 

II II I I MM I I I I I I II I I I I I I I I II II I I II I II I I II I II M I I I II I 

GTCGAACCTGGCAACTACGTGCAGATGTTCCCATACCCCTGCTACACCCGTGACGACTTC 2094 

CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2194 

M II I I I M I I I I I II I I I I II M I I I II I M I I II I I I I I I I I I I I II M I I III 
CTGTTTGTCATTGAACACATGATGCCATTGTGCATGGTGATCTCCTGGGTCTACTCTGTG 2154 



II I I I I I I I I I I I II I I II I I I I I I I I II MIMI I I I I II I I I I II I I I II I I I 
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Db 
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ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

|| I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGATGGGCCTGAACAACGCCGTGCACTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAG 2274 

CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2374 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II MINI 
CTGTCTATCTCCGTGACAGCTCTGACCGCCATCCTCAAGTACTGCCAGGTGCTCATGCAC 2334 

AGC CAC GT GGT CAT CAT CT GGCT CTT CCT GGCAGT CTAC GCGGT GGCCACCAT CAT GT T C 2434 
I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I II I I I I 
AGCCACGTGCTCATTATCTGGCTCTTCCTTGCCGTCTACGCTGTGGCCACTATCATGTTT 2394 

TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2494 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I Ml I I I I I I I I I I II II II III 
TGCTTCCTGGTGTCTGTGCTGTACTCTAAGGCTAAGTTGGCCTCAGCCTGTGGCGGTATC 2454 

AT CT ACT TCCT GAGCTAC GT GCCCTACAT GT ACGT GGCGAT CCGAGAGGAGGT GGCGCAT 2554 

I I I I I I I I I I I I I II I 1 M I I I I I I I I I I I I I I I I M IN 

AT CT ACT T C CT GAGCTAC GT T C C CT ACAT GT AT GT AGC GAT C C G CGAGGAG GT AG C C CAT 2514 

GATAAGAT CAC GGCC T T C GAGAAGT G CAT C G C GT C CCT CAT GT C CAC GAC GGCCTTTG GT 2 614 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I 
GACAAGAT CACT G C CTT C GAGAAGT GCAT T GC GT C CC - GAT GT C C ACAAC AGC CT T T GGC 2573 

CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGG CATCCAGTGGCA 267 0 

Mill II II I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

CT GGGT T C CAAGT ACT T T GC ACT GT AT GAAGT GGCAGGAGTGGGC AT C CATCCAGTGGCA 2633 

CACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCAT 2730 

I M I I I I I I II I I I I I I I I I I I II II I I I I I I I I II I I II I I I I I I I I I M I 

CAC GT T C AG C C AGT C C C C AGT G GAAG GAGAT GACT T CAAT CTGCTCCTT G CT GT CAC CAT 2693 

GCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCC 27 90 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
GCTTATGGTGGACACGGTGGTCTACGGCGTGCTCACTTGGTACATTGAGGCTGTGCACCC 2753 

AGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGG 2850 

III M I I I I I I I II I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I 



CAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAG 2910 

I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I III M I I I I I I I I 
CAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCATGGGCACACACACCGCGCCTCAG 2872 

T GT CAT G GAGGAGGA- C CAGGC CT GT GC CAT G GAGAGC C GGC GCT T T GAGGAGAC C C GT G 2969 

|| I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I III I I I I I I I I I II I 
CGTTATGGAGGAGGATCCAGGCCTGTGCCATGGAGAGCCGGCACTTCGAGGAGACCCGCG 2932 

GCAT GGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACT CAC CAAGG 3029 

I I I I I I I I I I I I I I I I I 1 I 1 I M I 1 I I I I I II I I I I I I I I I I I I I I I I I II I I I I 

GCATGGAGGAGGAGCCCACCCACCTGCCCTTGGTCGTCTGTGTGGACAAGCTCACCAAGG 2992 
T CT ACAAGGAC GACAAGAAGCT GGC C CT GAACAAG CT GAGC CT GAACCT CT AC GAGAAC C 3089 

| | I I III I I II I I I I I I I II I I I I I I I I I I I I I I I I I M II II Mill I 

T CT ATAAGAAT GACAAGAAGCT GGCCTT AAACAAACT GAGCCT CAAT CTGT AT GAGAAT C 3052 
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Db 
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AG GT GGT CT C CT T CT T GG GC CACAAC GG GG CGGGCAAGACCACCAC CAT GTC CAT CCTG A 3149 

I I I I I I I I I I III I I I I I I I I M I I I I I I I I I II I II I I I I I I I I I I I I I I I I I 
AGGTGGTCTCTTTCCTAGGCCACAACGGGGCCGGCAAGACCACGACCATGTCGATCCTGA 3112 

CCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGG 3209 

I II I I I I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
CTGGACTGTTCCCACCCACGTCGGGCTCAGCCACTATCTATGGGCACGACATCCGCACCG 3172 

AGAT G GAT GAGAT C C G CAAGAACCT GG GC AT GT GC C C GC AGC ACAAT GT GCT CT T T GAC C 3269 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I 
AGATGGATGAGATCCGCAAGAACCTGGGCATGTGCCCACAGCACAACGTGCTCTTTGACC 3232 

GGCT CAC GGT G GAG GAAC AC CT CT G GT T CT ACT CACGGCT CAAGAGC AT GG C T CAG GAGG 3329 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I Mill I I I II I I I I I I I I I I 

GGCTCACGGTGGAGGAGCACCTCTGGTTCTACTCACGCCTCAAAAGCATGGCACAGGAGG 3292 

AGAT C CG C AGAGAGAT GGACAAGAT GAT C GAGGAC CT GGAGCT CT C CAACAAAC GGCACT 338 9 
I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
AGAT C C GCAAAGAGAC GGACAAGAT GAT T GAGGAC CT GGAACT CT CTAACAAG C GGCAC T 3352 

CACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCG 34 49 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I 
CACTGGTGCAGACGTTGTCTGGAGGCATGAAGCGCAAGCTTTCGGTAGCCATTGCCTTTG 3412 

TGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGC 3509 

I I I I I I I I I I I I I I I I III I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
TGGGTGGCTCTAGAGCCATTATCTTAGACGAGCCCACGGCTGGCGTGGACCCCTATGCTC 3472 

GCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCA 3569 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
GCCGTGCCATCTGGGACCTCATTCTGAAGTACAAGCCGGGCCGCACTATCCTCCTGTCTA 3532 

CCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGA 3629 

MM I I I I II II M I II I I I I II I I II Mill I I II I II II II II I I I I M M M I I 

CC C AT C AC AT GGAT GAG GCT GACC T GCT GGGGGAT C GC AT T GC CAT C AT CT C C CAT GGGA 3592 

AGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCC 368 9 

I I II I I I I I II I I II I I II II I II I II I I I I I I I I I I I I: M I I I I I II II II 
AGCTCAAATGCTGTGGCTCTCCCCTCTTCCTCAAGGGAGCCTATGSSGATGGGTACCGCC 3652 

TCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCA 3749 

I I I I II I I II I I I III II II M II I II II I I I I II II II II II I I I M 
T CAC AT T GGT CAAGCAGC CT G CAGAAC CT GG C AC C T C C CAAGAGC CAGGG CT G G C T T C CA 3712 



I II II M M I I I I I I I II M M I II I I I I I II II II II II I I II II M II 



GCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCC 3869 

I || I I I II II II I II I I I II II II I I I I I I M II I I II I I II I II II II I II I I II 
GCAAGCATGTGGCTTCCTCCCTGCTGGTCTCAGACACGAGCACCGAGCTCTCCTACATCC 3832 

TGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCA 3929 

II II II II I II II II II II I II II II I I I II I I I I II II II II II I II II I I M 
TGCCCAGCGAGGCCGTCAAGAAGGGGGCCTTCGAGCGCCTCTTTCAGCAACTGGAACACA 38 92 



3930 GCCTGGATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGT 3989 
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1 1 1 1 1 1 1 1 1 1 II II II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 II 

GCCTGGATGCGCTCCATCTGAGCAGTTTTGGGCTGATGGACACAACTCTGGAGGAGGTGT 



3952 



T C CT CAAGGT GT C G GAGGAG GAT C AGT C GCT G GAGAAC AGT GAGG C C GAT GT GAAG GAGT 4 049 
I I I II I I I II I I I M M I I I I M I I I I II I II I M I I I M I II I I I I I I I I I I I 
T C C T CAAGGT GT CT GAAGAAGAT C AGT C ACT G GAGAAC AG C GAG GC T GAT GT GAAG GAGT 4 012 

CCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCA 4109 

|| I I I I I I I I I I II I I I I I I I I I i I I I II I I I M II I I I II I I I I I I I I 
CCCGGAAGGATGTNCTGCCTGGGGCAGAGGGCCTGACAGCTGTGGGGGGTCAAGCTGGCA 4072 

ATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTG 4169 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II M I I I I 
ACCTGGCTCGGTGCTCAGAGCTGGCACAGTCACAGGCATCGCTGCAGTCTGCATCCTCTG 4132 

TGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCC 4229 

I I I I I I II I I I I I I I I M I I I I I I I I I I I I I M I IN II I I I I I M I I 
TGGGCTCTGCCCGTGGGGAGGAGGGCACCGGCTACTCTGATGGCTACGGTGACTACCGTC 4192 

CCCT CT T T GAT AAC C C AC AGGAC C C AGACAAT GT C AGC CT GC AAGAGGT GGAGGCAGAGG 4289 

I I I I I I I II I III I I I I I I I I I I I I I I II I I I I I I I I I I I I I III MM 

CCCTCTTT GACAACT T GC AG GACC CAGACAAT GT C AGCT T ACAAGAGGC AGAGAT GGAGG 4252 

CCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCC 434 9 

I M I I I III II II I I I II II II I I II II II I I I I M M I I II I I I I I I I 
CCCTGGCTCAGGTGGGCCAGGGCAGCCGCAAACTCGAGGGCTGGTGGCTGAAGATGCGGC 4312 

AGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCT 4 4 09 

I | || II I Mill II II I II I I II I I M I M II II II I II II I M II II II 
AGTTCCATGGGCTCCTGGTGAAGCGCTTCCACTGTGCTCGTCGGAACTCCAAAGCTCTCT 4372 

TCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCG 4469 

I II I I II II II I I I I I I I I I I M M M I M M I I M I I 

GCTCTCAGATTCTGCTGCCTGCCTTCTTTGTCTGTGTGGCCATGACTGTGGCGTTGTCTG 4432 

T C CC GGAGATT GGT GAT CTGCCCCCGCTGGTCCT GT C AC CT T C C C AGT AC C ACAACT AC A 4529 

I I I I II II I II I I II II II II I M II I I I II I I II II I I I II I M I II I I I II 

TCCCTGAGATTGGTGACCTACCTCCACTGGTCCTGTCACCCTCTCAGTACCACAACTACA 4492 

CCCAGCCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGC 458 9 

I || || I II I I I I II II M I M M II II I M I I I I I II M II I M M I II 

CC CAGC C C C GT GGCAACT T TAT CCCT TAT GC CAAT GAGGAAC GC CAGGAGT AC C GAT TAC 4552 

GGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGG 464 9 

MM II M II II M M I M I I M II II II II I I II I I II I I II II I II M I 
GGCTGTCACCTGATGCCAGCCCCCAGCAGCTGGTGAGCACATTCCGGCTGCCCTCTGGTG 4612 

TGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACC 4709 

I I II I I II M II II II II II I II II I II I I II M I II I I I I I I I I I I I I I I I 
TGGGTGCCACTTGTGTGCTCAAGTCTCCTGCCAACGGCTCCCTGGGACCCATGCTGAACT 4672 



I I II 



I I I II I II I I I I I I I I I I I I I I I I I I II I II I I I II II I I I I I I II 



CCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCAT 4 82 9 
I I II I I I I I II I I I I I I I M II M I I I I I I II M I I I II II I I I II I I I II I I I I 



Db 


4733 


Qy 


4830 


Db 


4793 


Qy 


4887 


Db 


4853 


Qy 


4947 


Db 


4913 


Qy 


5007 


Db 


4973 


Qy 


5067 


Db 


5033 


Qy 


5127 


Db 


5093 


Qy 


5187 


Db 


5153 


Qy 


5247 


Db 


5213 


Qy 


5307 


Db 


5273 


Qy 


5367 


Db 


5333 


Qy 


5427 


Db 


5393 


Qy 


5487 


Db 


5453 


Qy 


5547 


Db 


5513 


Qy 


5607 


Db 


5573 



4733 CCTTCACACAGGGGCTGCCACTGTCCAACTTCGTGCCACCTCCGCCCTCACCCGCCCCTT 4792 

CTGACTCGCCAGCGTCCCCGGATGAGGA CCTGCAGGCCTGGAACGTCTCCCTGCCGC 4886 

I I I I I I I || I I I : I I I I I I I I I I I I II I I MINIMI I I I I I I I I I I 

CT GACT C AC C C GT GT S C C CAGAT GAG GAT T C ACT G CAAGC CT G GAAC AT GT C C C T GCC AC 4852 

CCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGC 4 946 

I II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I II I MM 
CTACTGCTGGGCCAGAGACGTGGACGTCGGCGCCTTCTCTGCCACGCCTAGTGCATGAGC 4912 

CCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCG 5006 

I I I II I M I M I I I I II I M M II Mill III I II I 

CAGTCCGCTGTACCTGCTCTGCACAGGGCACGGGGTTCTCATGCCCCAGCAGTGTGGGTG 4972 

GGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGACATCACCGGCCACA 5066 

I II I II I II I I I II I I I II M II I I I I II II I II M II II I I I II I I II II I I 
GACAC C C AC C C CAGAT GAGAGT GGT CACAGGT GACAT C CT GACT GAC AT C AC T GGC CAC A 5032 

ATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCA 5126 

II M M II II I II M I I M I I II II I I Mill M II II I I Mill Mill MM 

AT GT T T CT GAGT ACCT GCT CT T CAC CT CT GAC C GT T T C C GACT ACAC CGAT AT GGAGC C A 5092 

TCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCA 5186 

I I II I I I II I II II I M M II I M I I I II II Mill II III III II I 
TCACCTTTGGTAATGTTCAGAAGTCTATCCCAGCATCCTTTGGTGCCCGGGTCCCTCCTA 5152 

TGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATC 5246 

Ill I II I II I I I I I M M M I M II II I M M I 

TGGTGCGGAAGATTGCAGTGCGGAGGGTGGCTCAGGTGCTCTACAATAACAAGGGCTACC 5212 

AC AGCAT G CC C AC CT AC CT CAACAGC C T CAACAAC G C C AT CC T GC GT GC CAAC CT G CC C A 5306 

I M M M M II II II M M M M M M II II M I I II I I I M II I I I II I II I I II 



AGAGC AAGGGCAAC C CGGC GGCTT AC G GC AT CAC C GT CAC CAAC CAC C C CAT GAAT AAGA 5366 

I I I I II I I I I I I II II II II I I I II II I II I I M II II II II I I M I II I II I 

AAAGC AAG GG CAAT C CAGCAGC CT AT GGC AT CAC C GT CAC CAAC CAC CC CAT GAACAAGA 5332 
CCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCT 5426 

I I I I M I I I II I II II I II M II I I I I I I II II I II Mill M II I II I I M I I 

CCAGTGCTAGCCTCTCCCTGGATTACCTACTGCAGGGNACAGATGTGGTCATCGCCATCT 5392 

TCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGA 5486 

I I I I II I I M I I II I II I I I I II II I I II II I II II I II II I MM 

TCATCATTGTGGCCATGTCCTTCGTGCCAGCCAGCTTTGTGGTCTTCCTTGTGGCAGAGA 5452 

AGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGC 5546 

I II M I II I I I M I I II I II I I I II I I I M I M I M II I I I I II I I II I I I II 

T^ATCCACCAAGGCCAAACACCTGCAGTTCGTCAGCGGGTGCAACCCTGTCATCTACTGGC 5512 
TGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCA 5606 

II II II II I M II I I II II II II M I I II I I I II I I II M II II I I II II MM 

T GG C CAACT AC GT GT GGGAC AT GCT CAAT T AC C T GGT C C C AG C CAC CT GCT G C GT GAT C A 5572 

TCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCT 5666 

I I I I Mill II III I II I I II II I I M I I II M I II I II II M M I I M 
TCCTCTTTGTCTTTGACTTACCTGCCTACACATCACCCACCAACTTCCCCGCGGTGCTCT 5632 



Qy 


5667 


Db 


5633 


Qy 


5727 


Db 


5693 


Qy 


5787 


Db 


5753 


Qy 


5847 


Db 


5813 


Qy 


5907 


Db 


5873 


Qy 


5967 


Db 


5933 


Qy 


6027 


Db 


5993 


Qy 


6087 


Db 


6053 


Qy 


6147 


Db 


6113 


Qy 


6207 


Db 


6173 


Qy 


6267 


Db 


6233 


Qy 


6327 


Db 


6293 


Qy 


(TORT 

too / 


Db 


6353 


Qy 


6447 


Db 


6413 



CCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGT 

II | I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTTGTTCCTGCTCTATGGGTGGTCCATCACACCCATCATGTACCCAGCCTCCTTCTGGT 



5726 



5692 



5786 



TCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCA 

I II I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
TTGAGGTCCCTAGCTCAGCCTACGTGTTCCTCATTGTCATCAACCTCTTCATCGGCATCA 5752 

CCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTG 5846 

I I I I I I I I I I I I I I I I I I I II I I I I I M I I I II I 1 I I I I I I I I I I 

C AGC C AC GGT G G C CACTT T C CT T C T G CAG CT T T T T GAGCAT GACAAG GAT CT GAAG GT T G 5812 

TCAACAGTTACCTG7W\AGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGC 5906 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCAACAGTTACCTGAAAAGCTGCTTCCTCATCTTCCCCAACTACAACCTGGGCCACGGGC 5872 



T CAT GGAGAT GGC CT ACAAC GAGT AC AT CAAC GAGT ACT AC GC CAAG AT T GGC C AGTT T G 
I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
T CAT G GAGAT GGC CTACAAT GAGT AC AT CAAC GAAT ACT AC GC CAAGAT T GGC C AGT T T G 



5966 



5932 



6026 



ACAAGAT GAAGT C C C C GT T C GAGT GGGACAT T GT C AC C C GC GGAC T G GT GGC CAT G GC GG 
I | | | | I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 
ACAAGAT GAAGT C C C C GT T C GAGT GGGACAT T GT CACAC GT GGACT GGT G GC C AT GACAG 5992 



TTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGC 

| | 1 | | | | I I I I I I I III I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M 
TCGAGGGCTTCGTGGGATTCTTCCTCACCATCATGTGCCAGTATAACTTCCTACGGCAGC 



6086 



6052 



C AC AG C GC AT G C CT GT GT CT AC CAAG C CT GT GGAGGAT GAT GT GGAC GT GGC C AGT GAGC 614 6 
I I I I M I I I I I I I I I I I I I I II I I I I I I II II 11 I I I I I I I I I I I I I I I I I I 
C ACAACGC CT GC C T GT GT CT ACT AAACCT GT G GAAGAC GAT GT GGAT GT G GCT AGT GAG C 6112 



GGCAGCGAGT GCT CCGGGGAGACGCCGACAAT GACAT GGTCAAGATT GAGAAC CTGACCA 
| Ml I I I I I I I I I I II II II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I 
GACAGAGAGT GCT CCGT GGCGAT GCT GACAAT GACATGGT CAAGATT GAGAACCT GACCA 



6206 



6172 



AGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTG 6266 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
AGGTGTACAAGTCTCGGAAGATTGGCCGGATCCTGGCAGTGGACCGCCTTTGCCTGGGTG 6232 

TGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCT 6326 

| | I I I I I I I I I I I I I II I I I I I I I I II I I I I I Mill II I I I I I I I I I I I I I 
TGCGCCCTGGAGAGTGCTTTGGGCTCCTTGGTGTCAATGGTGCAGGGAAGACCAGCACCT 62 92 

T CAAGAT GCT GAC C GGC GAC GAG AGC AC GAC GGGG GGC GAGGC CT T C GT CAAT GGACAC A 638 6 
I M I I II M I I II II II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I 
T CAAGAT GCT GACT GGAGAT GAGAGCACAACT GGGGGAGAGGCCTTT GT CAAT GGACACA 6352 

GCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACG 644 6 

I I I I I Ill I I I I II I I I I I I I I 

GCGTGCTCAAGGACCTGCTCCAGGTACAGCAGAGCCTTGGCTACTGCCCGCAGTTTGATG 6412 

CGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGA 6506 

| | | I I I II I I I I I I I I II I II II I I I I I I I I I II I I I I I I I I I I I I I I I I M I 
CCCTGTTTGATGAGCTCACGGCTCGTGAACACCTGCAGCTGTACACGCGGCTGCGTGGCA 6472 



Qy 


6507 


TCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCA 

|| | | | | | I I I I 1 1 1 1 1 1 1 III 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TCCCCTGGAAGGATGAGGCACAGGTAGTGAAGTGGGCCCTAGAGAAGC 1 GGAACTOACAA 


D *J U D 


Db 


6473 




Qy 


6567 


AGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGG 

MM 1 1 II 1 1 1 1 1 II 1 II 1 II 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 
AGT AT GC AGACAAG C CAGCT G G C AC CT AC AGT GGAGGCAAC AAAC G GAAGCTT 1 C CACAO 




Db 


6533 


DO y Z 


Qy 


6627 


C CAT C GC CC T CAT T GG GT AC C C AG C CTT CAT CT T C CT GGAC GAG C C C AC C AC AGG CAT G G 

MM 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 

CCATTGCCCTCATTGGGTACCCTGCCTTCATCTTTCTAGATGAGCCCACCACTGGCATGG 


DOOD 


Db 


6593 


£ £ R O 


Qy 


6687 


ACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTT 

MM 1 1 II 1 1 II 1 II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M II 1 1 1 1 1 1 1 MM 

ACCCTAAGGCCCGGCGCTTCCTGTGGAACCTCATTCT GGAC CT CAT CAAGACGGGACGTT 


c^n a ^ 

D / 4D 


Db 


6653 


CI 1 o 
D / 1Z 


Qy 


6747 


C AGT G GT GCT GAC AT C AC AC AG CAT GGAGGAGT G C GAG G C GCT GT GCAC GC GGCT GGC C A 

1 II II II II 1 M II 1 1 1 1 II 1 1 1 1 1 II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II II 

CGGTGGTGCTGACGTCACACAGCATGGAGGAGTGTGAGGCTCTGTGCACACGCTTGGCCA 


DO U D 


Db 


6713 




Qy 


6807 


TCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTG 

M | 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 II II II 1 1 II 1 1 1 1 1 II II II 1 1 1 1 1 M 1 1 1 
TCATGGTGAACGGGCGGCTGCGCTGCCTGGGCAGCATCCAGCACCTTAAGAACAGGTTTG 


C Q C C 
DODO 


Db 


6773 


OOOZ 


Qy 


6867 


GAGAT GG CT AC AT GAT CAC GGT G C GGAC CAAGAGC AGC C AGAGT GT GAAGGAC GT GGT GC 

1 II II II II II II II 1 1 1 II III M 1 M 1 1 1 II II II 1 1 1 1 

G GGAT GGCT AC AT GAT TACT GT AAGGAC CAAAAG CAGC C AGAAC GT GAAG GAC GT GGT G C 


b3Z D 


Db 


6833 


/z o n o 
DO 9Z 


Qy 


6927 


GGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGC 

I || || I I I II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 M 1 1 1 II 1 1 

G GT T CT T CAAC AGGAACT T C C CAGAGGC CAT GCT CAAGGAAAGAC AC CAT AC GAAGGT G C 


c c\ o a 

by o d 


Db 


6893 


by dz 


Qy 


6987 


AGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGG 

1 1 1 1 1 1 M 1 II II II II 1 1 1 1 1 II II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M II 1 1 M II 1 II 1 M 
AGT AT CAGCT C AAGT CAGAGCACAT CT CGCT GGCT CAGGT GTT CAGCAAGAT GGAGC AGG 


7046 


Db 


6953 


IU±Z 


Qy 

Db 


7047 
7013 


TGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGT 

II M 1 1 1 II II 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M II II Mill II II 1 1 
T GGT G G GT GT GCT GG GC AT C GAGGAT TACT C AGT CAGC C AGAC CAC C CT GGAT AACGT GT 


/ lUb 

""7 n i o 
/ 0 1 Z 


Qy 


7107 


T C GT GAACT T T GC CAAGAAGC AGAGT GACAAC CT G GAGC AGCAGGAGAC GG AGCC GC CAT 

1 II II II 1 1 1 1 1 II 1 II 1 M 1 1 II 1 1 II 1 M 1 1 1 1 1 II III 1 Mill 1 1 

T T GT GAACT T T GC GAAGAAGCAGAGT GATAAT GT GGAGC AG CAAGAGGC T GAGCC CT CGT 


/ Ibb 


Db 


7073 


I L6Z 


Qy 


7167 


CCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCA 

|| M MM 1 II M M II 1 II II II II 1 1 1 1 M II II 

CCTTGCCGTCCCCCCTT GGACTGCTCAGCCTGCTGAGGCCCCGCCCCGCACCCA 


/ ZZK> 


Db 


7133 


/loo 


Qy 


7227 


CGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCC 

1 I I II I I 1 I 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 M 1 1 1 M 1 1 1 1 1 II MM 
C AGAG C T C C G G GC ATT GGT GGCT GAT GAGC C AGAG GAC C T GGACAC AGAGGAT GAAGGC C 


/ Z o D 


Db 


7187 


7246 


Qy 


7287 


TCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGAC 

1 M II 1 1 II 1 M 1 II 1 1 1 II II II II 1 1 1 1 M 1 II 1 1 II II M 1 1 1 II II 1 1 II 1 1 
TCATCAGCTTCGAGGAAGAGCGGGCCCAGCTCTCCTTCAACACTGATACGCTCTGCTGAC 


7346 


Db 


7247 


7306 



Qy 



7347 CACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCCAGGGAC 7406 



1 1 I 1 1 I I I I I I 

Db 7307 CAT CAAGAG C CACAT C AGGGAT GCAG CT GT GT GG G GCAG AT GT C AGG C GGT GGCCGTGGC 7366 

Qy 74 07 TCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGG-AGGTTCAGGA 74 65 

| | I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 7367 CC CT AGT CAC AC AT G C C AG GC C CT G GAAAGGC AGGT T C AG GA 7408 

Qy 7466 CCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTT 7525 

1111:111111111 IN I 
Db 7409 CCAAARGGCTCCTGCCCTCCTCCCAACTACCAT 7441 

Qy 7526 GCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC-GGGCTGCGTACACCCTTGCCCTGC 7584 

I | I I I I I I II I I I II I I I I IN I I I I I I 

Db 7442 -CCTCCCCGT^ATTGTGCCAAAGGCTGGCCTGGCCCTGGGCTGCACATACCCTCACCCTGC 7500 

Qy 7585 TTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACC-G 7643 

II I III I I II IN IN II II IN M I I MM 

Db 7501 TTTGCCTTAAAGCCTTGGGTCCTGGCCCAGCCCCTTACCCTGCCCAGCACCATCCACCTT 7560 

Qy 7644 CCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGC 7690 

II I I I I II II I I I I I I I I I I I 

Db 7561 CCCAGGGTGACATGGGCTGCCCCAAGTATCCTGTGACTCTTCTCTGC 7607 
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Searched: 3373863 seqs, 2124099041 residues 

Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Minimum Match 0% 
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1: geneseqnl980s : * 

2 : geneseqnl990s : * 

3 : geneseqn2000s : * 

4: geneseqn2001as : * 
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SUMMARIES 



Result 



Query 





Score 


Match 


Length 


DB 


ID 


1 


8040 


100.0 


8040 


4 


AAF57452 


2 


8040 


100.0 


8056 


6 


ABV7 4 350 


3 


8036.4 


100.0 


8269 


6 


ABL53009 


4 


8032 


99.9 


8195 


4 


AAH75187 


5 


7973.2 


99.2 


8037 


7 


ABX70982 


6 


7529.2 


93. 6 


7610 


6 


AAD36299 


7 


6686. 8 


83.2 


6792 


5 


AAD02722 



Description 



Aaf57452 Human ABC 
Abv7435 0 Human ABC 
Abl53009 Human ATP 
Aah75187 Nucleotid 
Abx70982 Novel hum 
Aad36299 Human tra 
Aad02722 Human ATP 



8 


5810 


72. 


3 


8040 


6 


ABL53011 


Abl53011 


Rat ATP b 


9 


5810 


72. 


3 


8040 


7 


ABT42135 


Abt42135 


Toxicity 


10 


5536.8 


68. 


9 


5540 


6 


AAD27271 


Aad27271 


Human tra 


11 


2736.8 


34. 


0 


2740 


6 


AAS62249 


Aas62249 


cDNA sequ 


12 


991.4 


12. 


3 


7323 


3 


AAZ94746 


Aaz94746 


Human ATP 


13 


988 


12. 


3 


9870 


6 


ABN99317 


Abn99317 


Polymorph 


14 


988 


12. 


3 


9870 


6 


ABN99311 


Abn99311 


Polymo rph 


15 


988 


12. 


3 


9870 


6 


ABN99318 


Abn99318 


Polymorph 


16 


988 


12. 


3 


9870 


6 


ABN99326 


Abn99326 


Polymorph 


17 


986.6 


12. 


3 


6786 


8 


ACC84923 


Acc84923 


Human ABC 


18 


986.6 


12. 


3 


7784 


2 


AAV33392 


Aav333 92 


ATP bindi 


19 


986.6 


12. 


3 


7860 


4 


AAF92835 


Aaf92835 


Human ABC 


20 


986.6 


12. 


3 


7860 


5 


AAF83826 


Aaf 83826 


Human ABC 


21 


986.4 


12. 


3 


6880 


3 


AAZ94734 


Aaz94734 


Human ATP 


22 


986.4 


12. 


3 


6880 


4 


AAI70314 


Aai70314 


Human ATP 


23 


986.4 


12. 


3 


7260 


4 


AAI70315 


Aai70315 


Human ATP 


24 


986.4 


12. 


3 


7260 


4 


AAD21326 


Aad2132 6 


Human ATP 


25 


986.4 


12 


3 


9497 


6 


ABV78 020 


Abv7 8020 


Hypoxia-r 


26 


986.4 


12 


3 


9741 


4 


AAS06120 


Aas06120 


Human ABC 


27 


986.4 


12 


3 


9741 


6 


AAD37273 


Aad37273 


Human ABC 


28 


986.4 


12 


3 


9854 


4 


AAS06121 


Aas06121 


Human ABC 


29 


986.4 


12 


.3 


9870 


6 


ABN99307 


Abn99307 


Polymorph 


30 


986.4 


12 


.3 


9870 


6 


ABN99302 


Abn99302 


Polymorph 


31 


986.4 


12 


.3 


9870 


6 


ABN99305 


Abn99305 


Polymorph 


32 


986.4 


12 


.3 


9870 


6 


ABN99321 


Abn99321 


Polymorph 


33 


986.4 


12 


.3 


9870 


6 


ABN99323 


Abn99323 


Polymorph 


34 


986.4 


12 


.3 


9870 


6 


ABN99329 


Abn99329 


Polymorph 


35 


986.4 


12 


.3 


9870 


6 


ABN99319 


Abn99319 


Polymorph 


36 


986.4 


12 


.3 


9870 


6 


ABN99324 


Abn99324 


Polymorph 


37 


986.4 


12 


.3 


9870 


6 


ABN99331 


Abn99331 


Polymorph 


38 


986.4 


12 


.3 


9870 


6 


ABN99303 


Abn99303 


Polymorph 


39 


986.4 


12 


.3 


9870 


6 


ABN99301 


Abn99301 


Polymorph 


40 


986.4 


12 


.3 


9870 


6 


ABN99306 


Abn99306 


Polymorph 


41 


986.4 


12 


.3 


9870 


6 


ABN99332 


Abn99332 


Polymorph 


42 


986.4 


12 


.3 


9870 


6 


ABN99334 


Abn99334 


Polymorph 


43 


986.4 


12 


.3 


9870 


6 


ABN99304 


Abn99304 


Polymorph 


44 


986.4 


12 


.3 


9870 


6 


ABN99330 


Abn99330 


Polymorph 


45 


986.4 


12 


.3 


9870 


6 


ABN99308 


Abn99308 


Polymorph 



ALIGNMENTS 



RESULT 1 
AAF57452 

ID AAF57 452 standard; cDNA; 8 04 0 BP. 
XX 

AC AAF57452; 
XX 

DT ll-JUN-2001 (first entry) 
XX 

DE Human ABCA2 transporter protein encoding cDNA. 
XX 

KW ABCA2; transporter protein; gene therapy; cell transport; human; 
XX 

OS Homo sapiens. 
XX 



FH Key Location/Qualifiers 

FT CDS 35. .7345 

FT /*tag= a 

FT /product= "ABCA2 transporter protein" 
XX 

PN WO200121798-A2 . 
XX 

PD 29-MAR-2001. 
XX 

PF 31-AUG-2000; 2 000WO-US040789 . 
XX 

PR 20-SEP-1999; 99US-0154839P . 
XX 

PA (FOXC-) FOX CHASE CANCER CENT. 
XX 

PI Tew KD, Vulevic B, Chen Z; 
XX 

DR WPI; 2001-257989/26. 

DR P-PSDB; AAB62210. 

xx 

PT New nucleic acid molecule for screening inhibitors of human ABCA2 

PT mediated transport, encoding a human ABCA2 transporter protein with a 

PT multi-domain structure including glycosylation and phosphorylation sites. 

XX 

PS Claim 1; Fig 6A-B; 68pp; English. 
XX 

CC This cDNA encodes a human ABCA2 transporter protein having a multi- 

CC domain structure including a number of glycosylation and phosphorylation 

CC sites, a lipocalin signature motif, nucleotide binding folds having 

CC walker A and B ATP binding sites, and a number of membrane spanning 

CC helices. Human ABCA2 transporter polypeptides and nucleic acid encoding 

CC them are useful for identification, detection and/or molecular 

CC characterization of components involved in the transport of molecules 

CC across cell membranes. The nucleic acid is useful as a probe to detect 

CC the presence of and/or expression of genes encoding ABCA2 proteins, and 

CC in gene therapy. A host cell comprising the nucleic acid is useful for 

CC screening compounds that inhibit human ABCA2 mediated transport 

XX 

SQ Sequence 8040 BP; 1458 A; 2690 C; 2407 G; 1485 T; 0 U; 0 Other; 

Query Match 100.0%; Score 8040; DB 4; Length 8040; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 8040; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 


1 


CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 

I I I I 1 1 I 1 1 1 1 1 I I I I | | I 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 II II 1 1 1 1 

CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 


60 


Db 


1 


60 


Qy 


61 


GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 

| | | | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 


120 


Db 


61 


120 


Qy 


121 


CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 

I I I 1 1 M II 1 II 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M IN 

CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 


180 


Db 


121 


180 



Qy 



181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 240 



Db 


181 


| M | 1 I I I I I 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 11 1 1 

y. rr a ArT-rrrrTTPTAr APAr:rr;r;rGrcCCTGACGTCTGCCGGCATCCTGCC 


240 


Qy 


241 


TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 

I M 1 1 1 1 1 II 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 M II 1 1 1 1 1 1 1 M 1 1 1 1 1 M 1 1 1 

mrmp ^„ rrA ,m rrr m r m rrrrrrarr r rr a P*P GAG AC GAGT T C GGCTT CCT GCAGTAC GC 


300 


Db 


241 


300 


Qy 


301 


CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 

I I I | | | | | | I 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 

_ A rrrrrra rrr APPTPPTTr;APrPf;PPTGGACCGCGTGGTGGAGGAAGGCAACCT 


360 


Db 


301 


360 


Qy 


361 


GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 

^_ tmrp _, p^TvrrrrrrrrrarrrTrrrrTr AGAGPTPGAGGPCCTACGCCAGCATCTGGA 
GTTTGACCCAGUCjCooUUUAoU^ i booL i i ^ijAuu^^^inwwvvi ^ ^- ^ 


420 


Db 


361 


420 


Qy 


421 


GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 

| | M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 HI 

^^^mr^ rrvnnrrrrrrrrrr APPTPnPPf^AGPPAPCTGGACAGATCCACAGTGTCTTC 

GGCCC TLAb 1 bbbbbLLLbbbUnLO 1 ^oooo-rVo^^-ru^^ x oun^rvui-vx uvrivn.v 


480 


Db 


421 


480 


Qy 


481 


CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 

Ml | | | | | | I I I II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 Ml 

mm ^ mrimnrTir , rT . rrrr-rrTrrrrara a A ppppp A P^AGPTPTGGCGTTTCCTGACGCAAAA 


540 


Db 


481 


540 


Qy 


541 


CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 

| M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

_ mm ^ m ~~~ m/ -. ,-,7. A m a a rrrnr p a ar p a PTPTTGGPPGPPGGTGTGGACCCGCCCGA 

CTTGTCGCTGCCCAAT AbLAbbbbbbAAbL/\t l^l l buu^uu^^ui ox uurv^v^u^v^wi ». 


600 


Db 


541 


600 


Qy 


601 


GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 

| | M I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 M 1 1 

__ mr>irn7 . r>nrnr<r<rrrrvrnrrrr r rrrr T vr ATPTPPPPTGGATTGACAGTCTGGCCTCCACAA 
GGTCTAC CAOC 1 bb 1 bl 1 1 00 1 u^l^i ^ 1 o\^^^± vjo.ri.x 1 ^n^nui v-x ^^^^ ^ w ^ 


660 


Db 


601 


660 


Qy 


661 


GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 

| | | | | I I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 IN 

^r.^mn7\r/-7\rrnrrprrArr , rrrr r riDirrr;r;f;raATrrrrTGTTCCGGATGGAGGAGCTGCT 
GGGT CAGGAGCCL- TCj(jAoULroOUl/\^^w^jLjv^/^rt.i ^\^<^ox ox x v/^ouni vjw-ivjwv^v^ j- ^ 


720 


Db 


661 


720 


Qy 


721 


GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 

| | | | | | | | | | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 M 1 

_ m ^„^ rn _- rp ^^^ r .rp r ^ r rpr , r Arr Ar^PTrArrTGrArGrCGGGCTCGGGGGAGCTGGGCCG 

GCTGGCTCO 1 bbbb 1 L*L* 1 0 o/\o <w/\o 1 ^.rv^ ^ x u^n^ | jv>wuuu^ x ouuvjvjunuu 


780 


Db 


721 


780 


Qy 


781 


GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 

M 1 II | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

m „^ m ^, ^rp^rp^^^mr ap aptp Ar AA^^PrAnrrrTGCAGGGCTACCGGGATGCTGTCTG 

GAT CC 1 CAC1 Cj 1 bbb 1 0/Vo.M.ox ^/\o/\rtooo/\o^O^ 1 o^rvaovj^ in^uvjuui-i± a ^ -l. v * 


840 


Db 


781 


840 


Qy 


841 


CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 

| | I 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 

^7\/-r P r-r'/"r'7\r-r , nrrpr ,r rrrrrrTrrrAr:nrGrTTrTCTGGGCTGTCTGCTGAGCTCCGGAA 


900 


Db 


841 


900 


Qy 


901 


CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 

| | | | I I I M 1 1 1 1 1 | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

^ r«« t\ r* n *v r- n 7\ n r t r r r r a a r P T P P P A GP A G P T G GGC CT GGAT G C C C C CAAC GGCT C GGA 


960 


Db 


901 


960 


Qy 


961 


CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 

| M 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 
CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 


1020 


Db 


961 


1020 


Qy 


1021 


TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 

1 I I I M | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 


1080 



1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 10 8 0 



1140 



1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 

| II I I I I I I I I I I Ml I I I I I I I I I I I I I I M II I I I 

1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 12 00 

| | | | | | | | | | | | | I I | | I I I I I I I I I I I I M I I I I I I I I I I M I I I I I I I I I I I I I I I I I 
1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

| | | | | | | I M I I I I I I I I I I I I I I I I I I I I I I I M I UNI MMIMI 

12 01 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

12 61 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

M II I II M I I II II I I M II I M I II M I II II II I M I 

1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 
1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

I | | | | | | | | || II M I II II M M II II I II I M II II I II II M I II II I I I I M I II I 

1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 144 0 

|| | | | | | | | || || II I M I I II II II II I I I I M II II II M I II II I I M I Ill 

1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

| | | | || | || || || || I M I I II M II II I II I II M II I I II I M II I I I I II II I I II I 
1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I I II I I I I I I I I I II I I I M I II I I M II II II M II I II II I II I I II 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 



1501 



1560 



1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

| | | || || M II I II II I I I I I II I I I M II I I I II I M M II I I I M I I I I M II II II I 
1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

| | M I I I I I I M I M I I II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 



1681 



1740 



CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 

| | II II M II I M II II I I I I M I I II I II I M II II I I M II 

1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

1741 CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 1800 

| M II II I I I II M M I II II II I I II I II I M Ml 

1741 CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 1800 



1801 
1801 

1861 CTT 



TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 

|| || | | || || I II I I I II I I I II II I I I I I I II I I M I I M M I M II I II I M 

TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 



1860 
1860 
1920 



CCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 

| | | | | | | || | || I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I 1 1 1 1 1 1 1 1 1 
1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 



Qy 


1921 


CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 

,i,i i i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I 1 1 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 I t 1 1 1 1 1 

1 | 1 | 1 | | | | 1 | | M | I I M I 1 1 II 1 M 1 1 1 M 1 M 1 M 1 1 M 1 1 1 l l 1 1 l l l l l t l I i i i 

CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 


1980 


Db 


1921 


1980 


Qy 


1981 


TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 

i i i \ i i i i i i i i i i i i i I I I I I 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 

1 | 1 1 | | 1 | 1 | j || I 1 II 1 1 1 1 1 1 I 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 I 1 M 1 1 1 1 1 1 1 1 1 1 1 I i i 

TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 


2040 


Db 


1981 


2040 


Qy 


2041 


CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 

, , i i i i i i i i i i i i i i i i i i i I l i I I l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I i M 1 1 

| | | | | | | | I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 l M l l l l I I I i 

CGCC AT CAT C G AC ACT T T T GT G G GGCAC GAC GT G GT G GAGC C AG GC AGCT AC GT GC AGAT 


2100 


Db 


2041 


2100 


Qy 


2101 


GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 

i i i i i i i i i i i i i i i i i i i i i i i i t i i I I I I I l I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
| | M 1 1 1 1 M It II 1 1 1 1 1 1 1 1 I 1 I 1 1 M 1 1 1 1 1 1 l l l l I I I I I i i i i i M i i i i i i i i i 

GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 


2160 


Db 


2101 


2160 


Qy 


2161 


GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 

..it,! i i i i i i i i i i i i i i i i i i i i i i i i i 1 1 1 1 1 t 1 | | I I I I I I I I I I I I 1 I 

| | | | | || | | | | || | | | | I II 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 I 1 1 1 N II 1 1 1 1 1 1 1 1 1 1 1 1 I » l 

GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 


2220 


Db 


2161 


2220 


Qy 


2221 


GGAGAAGGAGCACCGGCT CAAGGAGGTGAT GAAGACCAT GGGC CTGAACAAC GC GGT GCA 
■ i i i i > i i i i i i i i i t l l l 1 1 1 1 1 1 1 1 1 1 1 ! I l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

| | | | | | | | I M 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 I I I I I I M i i i i i i i ii i i i m i i 
GGAGAAG GAGC AC CG GCT C AAGGAGGT GAT GAAGAC CAT GGGC C T GAACAAC GC GGT GCA 


2280 


Db 


2221 


2280 


Qy 


2281 


CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 

,,,,,, i i t i i i i i i i i i i i i i i t I I I l 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 11 1 II 1 1 1 

| M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 

CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 


2340 


Db 


2281 


2340 


Qy 


2341 


CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 

, > i i i i i i i i i i i i i i i i i i i i i I I I I I I II 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 11 1 1 1 1 1 

| | || | | | || || | I I II 1 II 1 1 1 1 1 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 " 1 1 1 1 1 1 1 l l 1 ' ' 1 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 


2400 


Db 


2341 


2400 


Qy 


2401 


CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 

i i t i i i i i i i i i i i i i i i i i I I M i l l l l 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | I M 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 I I M M i i i m i i i i i 

CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 


2460 


Db 


2401 


2460 


Qy 


2461 


CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 

, i i i i i i i i i i i i i i i i i i i i i I t 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 II 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | | | | | | | | | | | | | 1 | | | | | I I 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 I I I I 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 


2520 


Db 


2461 


2520 


Qy 


2521 


C AT GT AC GT GGC GAT CC GAGAGGAG GT GGC GC AT GAT AAGAT CAC GGC CT T C GAGAAGT G 

i i i i i i i i i i i i i i i i i i i i j i ii I I | 1 1 1 1 1 1 1 1 1 | | I | 1 | 1 | | | | | | | | | 

| | | | | | | | I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l l I I I I I i i i i i i i i i i 

CAT GT AC GT GG C GAT C C GAGAG GAG GT GGC GC AT GAT AAGAT CAC G GC CT T C GAGAAGT G 


2580 


Db 


2521 


2580 


Qy 


2581 


CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 

■ < i i i i i i i i i i t i i i i i I I I I l l 1 1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 t 1 1 I 
| j | 1 | | | | | | | | | | | | 1 I I 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 i 1 l l ' l I I i 1 1 1 1 1 1 1 1 1 1 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 


2640 


Db 


2581 


2640 


Qy 


2641 


TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 

| | | | | II 1 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 M 1 II 1 II 1 1 M 1 II II 1 1 1 1 1 M II 1 1 II 1 1 

TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 


2700 


Db 


2641 


2700 


Qy 


2701 


CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 

| | M | I I I I 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 


2760 


Db 


2701 


2760 



2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

M I I II I I I I I I I I I I I 1 I I I I M I I I I I- 1 I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

2 821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 88 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I M I I I I I I I I I 

2 821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 8 0 

28 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

2 881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2940 

2 941 GGAGAG CCGGCGCTTT GAG GAGAC C C GT G G CAT G GAGGAGG AG C C C AC C CAC CTGCCTCT 3000 

I I I I I I I I I 1 I I 11 I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I 

2941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

3001 GGTTGTCTGCGTG G AC AAAC T CAC C AAG GT C T AC AAG G AC G AC AAG AAG CTGGCCCT G AA 3060 

| | I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

I I I I I M I I I II I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I 

3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

| | | | | | | I I I I I I I I I I I I I I I I II I M M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

3181 CACCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTGGGCAT 3240 

| I I I I I I I I I I Mill I I I I I I I I I I I I I 

3181 CAC CAT C T AC GGG C AC GAC AT C C GC AC GGAGAT G GAT GAGAT C C G C AAGAACCT GGG C AT 324 0 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I | | || I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M II I I I I I I I I M I I I II I I I I I 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

3301 CTCACGGCT CAAGAGCAT GGCT CAGGAG GAGAT CCGCAGAGAG AT GGACAAGATGAT CGA 3360 

| M I I I II I I I I M II I I I I I I I I I I I II I I I I I M 

3301 C T CAC GGCT CAAGAG CAT GGCT CAGGAG GAGAT C CGC AGAGAGAT G GACAAGAT GAT C GA 3360 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

| | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

3361 GGACCTGGAGCTCTCCAAC7WVCGGCACTCACTGGTGCAGACATTGTCGGGTGGCATG7^A 3420 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 8 0 

I | || | I II I II I I I I II I I I I I I I I I I I I I M I I I I II I I I I I I 1 I I I I I 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I I I I I I I I | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

| | | M | | | | | | || | | | | I | I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 



3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 
3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

M I I I I I I II I I I I II I I I II I I I I I I I I M I I I I I I I I I I M I I I I I I I I 1 I M I I I I I 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

| M I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 1 I I I I I I I I M 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I II I I I I I I M I I I M I I II I I II I I I I I I I I I I I I I I I I I I 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 390 0 

| | M I I I I I 1 I I II I I M I I I I I I I II I I I I I II I I I I I I I I I I M I M 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

| | | || | | | | | | I I I || I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

3961 G CT GAT GGAC AC G AC C CT G GAG GAAGT GT T C C T C AAGGT GT C GGAG G AGGAT C AGT C G CT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3961 GCT GAT GGAC AC G AC C CT GGAG GAAGT GT T CCTCAAGGT GT CGGAGGAGGAT C AGT CGCT 4 020 

4021 G G AG AAC AGT GAG G C C GAT G T G AAG G AGT C C AG G AAG GAT GTGCTCCCTGGGGCG GAG G G 4080 

I I I I I I I I I I I I I .1 I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 021 GGAGAACAGT GAGGCCGAT GTGAAGGAGTCCAGGAAGGAT GT GCTCCCTGGGGCGGAGGG 4080 

40 81 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

I M I M I | M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I 

4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

| | || M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 00 

42 01 CT AC AC C GAC GT C TAT G G C GACT AC CGCCCCCTCTTT GAT AAC C C AC AGGAC C C AGAC AA 4260 

| | | || | | | | | | | I I I I I II I II I II I M I I I I I II I I I I I I I I I I I I I I M I I I I 

42 01 C T AC AC C GAC GT C TAT G G C GACT AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AGAC AA 42 60 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

| || | | | | I I I I I I I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I II II I I I I 

42 61 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

|| | || M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 44 4 0 

| I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I M I I 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

44 41 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 450 0 
|| M || I II I II II II M I I II I I I II I I I II I I I II I I I I M I I I II I M I M I I I I I I 



4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 
4 501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I M I I I I I I I I I I I I M M I I I I I I I I I M I I I M I I M I I I I I I I I 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

| | | | | | M I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 68 0 

4 681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

| | | | | | | | | | | | || I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

| | II I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

48 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 48 60 

| | M II I I I I I I II I I I I I I I I I I I M 

48 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 860 

48 61 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 920 

| | | | | | | | | | | | || I I I I I I I I I II I I I I I I I I II II I I I I I I I I I I I I I I I I N I I I I I 
4 861 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

4 921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4980 

| | | | | | | | | | | | | | I I I I I I I I I I I I I I I I II I I II M I M I I I I II I I I I I I I I I I I I I 
4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4 980 

4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5040 

| | | | | | || | | I I I || I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

5041 CAT C CT GACCGACAT CACCGGCCACAAT GT CT CT GAGTAC CT GCT CTT CAC CT CC GACCG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I 1 I MINIM I II I I M I I I II I I 

5041 CAT C CT GAC C GAC AT CAC C GGC C ACAAT GT CT CT GAGTAC CT GCT CTT CAC CT CC GAC C G 5100 
5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

M II I I II I II I II I I M I I II I I I II II I I I I II M I I II M M I M I I I II II 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 
5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

M I I II I II I II I I I I II I II M M M I I I II II I I M II M II II M II M M 

5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 522 0 
5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5280 

M I I II II I II I I II II I II M M I I I II I II II I M M I I I II II M II I II II 

5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5280 
5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

|| || M II I II I I II M I I M II M II I I I M II I I I I I I II II I I II II I II 1 II M I I 

52 81 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5340 



Qy 


5341 


C GT CAC CAAC C AC C C CAT GAAT AAGAC C AGC GC C AGC CT CT CC CT GGAT T AC C T G C T G C A 

i i i i i i i i i i i i i i i i i t i I I I I 1 I 1 1 I 1 1 I 1 1 1 t 1 1 1 1 1 t 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 
| | | | 1 | | | | | ] | 1 1 M 1 M 1 II 1 1 1 1 1 I 1 I M 1 1 1 1 M 1 l l i i i i i i i i i i i i i i i i i i i 

CGTCACCAACCACCCCATGAAT7\AGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 


5400 


Db 


5341 


5400 


Qy 


5401 


GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 

i i i i i i i i i i i i i i i i i i i I l I l l l l 1 l 1 1 l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 I 1 1 1 1 
| | 1 1 1 | | I | 1 | 1 I 1 1 1 1 I II 1 1 M 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 l l l l l 1 1 ■ I i i i i i i i i 

GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 


5460 


Db 


5401 


5460 


Qy 


5461 


CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 

i i i i i i i i i i i i i i i i i i i i i i I I I I I I I I 1 l l l l l I 1 1 1 1 t 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 
| | 1 | 1 | | | | 1 | I | I I 1 1 1 M 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 M 1 H 1 M 1 M M > ■ 1 1 1 1 1 1 i i 

CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 


5520 


Db 


5461 


5520 


Qy 


5521 


CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 

i i i i i i i i i i i i i i i i i i i i i i i i i i I i I I i I I I I I 1 t II i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
| | | 1 | | | | 1 | | | | 1 1 1 M 1 1 1 1 1 1 1 1 It 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 M 1 1 1 1 l 1 1 1 1 1 1 1 

CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 


5580 


Db 


5521 


5580 


Qy 


5581 


GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 

i i i i i i i i i i i i i i i i i i t i i i i i i i i i t I I l l l l t l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
| | | | | | 1 | | M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M M M II 1 1 1 1 1 

GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 


5640 


Db 


5581 


5640 


Qy 


5641 


GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 

, i i i i i i i i i i i i i i i i i i i i i i i i I l l l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 

| | | | | | | I I M I I I 1 1 1 1 11 1 1 1 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 l l I 

GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 


5700 


Db 


5641 


5700 


Qy 


5701 


CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 

i i i i i i i i t [ i i i i i i i ii i i I | I 1 1 | 1 1 1 1 1 1 1 | | | | | | | 1 | | | | | 

| | | ! | | 1 | | I I I M 1 1 M I 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 i i i i i i i i i i i i i i i i i i 

CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 


5760 


Db 


5701 


5760 


Qy 


5761 


TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 

■ i i i i i i i i i i i i i i i i I I i I I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 11 1 1 1 1 1 1 

| | | | | | | 1 I I I I 1 I I 1 1 1 1 1 ! 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 I l 1 I I I i i i i i i i i i i 

TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 


5820 


Db 


5761 


5820 


Qy 


5821 


C GAGC AC GACAAG GAC CT GAAG GTT GT C AAC AGT T AC CT GAAAAG CT GCT T CCT C AT T T T 

t i i i i i i i i i i i i i i i i i i i i i i i I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 

| | | | | | | | | | 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 I II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 l l i I I I 

C GAG CAC GACAAG GAC CT GAAG GT T GT CAAC AGT T AC CT GAAAAG CT GCT T C CT C AT TT T 


5880 


Db 


5821 


5880 


Qy 


5881 


CCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGA 
, i i i i i i i i i i i i i i i i i i i i | | | ii | | | i 1 I | 1 1 1 | 1 1 | | | 1 | | || 

| | | | | | | | | | | | | | | | | | | | 1 | | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

C C C CAAC T ACAAC CT GGG C CAC G GGCT CAT G GAGAT GGC CT ACAAC GAGT AC AT CAAC GA 


5940 


Db 


5881 


5940 


Qy 


5941 


GT ACT AC GC CAAGAT T GGC C AGT T T GAC AAGAT GAAGT C C C C GT T C GAGT G G GAC AT T GT 

i i i i i i i i i i i i I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 

| | | | | | | | I I I I 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I i i i i l i i i i i i i i i i 

GT ACT AC GC CAAGAT T G GC CAGT T T GACAAGAT GAAGT CC CC GT T C GAGT GG GAC AT T GT 


6000 


Db 


5941 


6000 


Qy 


6001 


CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 

,,,,11 i i i i i i i i i i i i i i i i i i i i i 1 1 1 1 1 1 1 1 1 1 1 1 1 l| 1 | I l| | 1 | | | | 1 1 

| | | | | | M M 1 1 1 1 1 1 I 1 I 1 II 1 1 1 1 1 1 1 I l I I M I I I I i i i i ii i i i i i m i i i i i i i i 

CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 


6060 


Db 


6001 


6060 


Qy 


6061 


GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 

|| | | | | | 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 II II M II 1 1 1 1 
GTGCCAGTAC7VACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 


6120 


Db 


6061 


6120 


Qy 


6121 


G GAT GAT GT G GAC G T G G C CAGT GAG C G G C AG C GAGT GCTCCGGG GAG AC G C C G AC AAT G A 

| | M | I I M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 M 1 

GGAT GAT GT GGAC GT GGC CAGT GAG C G G C AG C GAGT G CT C C G GG GAGAC GC C GACAAT GA 


6180 


Db 


6121 


6180 



Qy 


6181 


CAT G GT C AAG AT T GAG AAC C T G AC C AAG GT C T AC AAGT C C C G GAAG AT T G G C C G T AT C C T 
1 | | | | | | 1 | | | | | I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 


6240 


Db 


6181 


6240 


Qy 


6241 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 

| | M | | | | | | | M | 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

r . r .mr rr . a r'rrrr'TRTKrrTGf;f;TaTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 


6300 


Db 


6241 


6300 


Qy 


6301 


CAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGG 

| | | | | | || || | | | I I 1 1 1 1 II 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

r7\7\r-rrTrrrrrraar;ArrAGrArCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGG 


6360 


Db 


63 01 


6360 


Qy 


r o a i 

6361 


GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 

| | | | I 1 1 II M 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 

n r r nr a r r r r mm r r t r A AT CC A C A C AGC GT GCT GAAGGAGCT GCT CCAGGT GCAGCAGAG 


6420 


Db 


6361 


6420 


Qy 


6421 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 

| | | | I I 1 1 | | I I II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

^^ m ^_^^ m ^ nm ^ nnrrr(7A rTr:Tr:Arr^rr^rTnTTCGACGAGCTCACGGCCCGGGAGCACCT 


6480 


Db 


6421 


6480 


Qy 


6481 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 

| | | | | | | | 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

r n a r rrpr t a n t\ r r r r r r t r C CSV CCC ATC T C CT GGAAGGAC GAGGC CCGGGT GGTGAAGT G 


6540 


Db 


64 81 


6540 


Qy 


6541 


GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 

M | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

-_ rm -„ rrAr , nrr m rrT . rr m r 7\ rr 7\ AnTArGrAGACAAGCCGGCTGGCACCTACAGCGG 


6600 


Db 


6541 


6600 


Qy 


6601 


CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 

| | | | | | I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

r>rr-r*7\T\r<7K 7\mrr AArrTTTrr Ari^rCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 

CGbLAALAAbLbbnAbb 1 b x bL/\^bo^^Al V/U^^ui wi.x ± vjvjw .l.£-».\^\^vw i^.v^w j. 


6660 


Db 


6601 


6660 


Qy 


6661 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 

| | | | 1 1 1 1 1 1 1 1 1 1 1 1 1 HI 1 1 1 1 1 111 1 1 1 1 1 1 1 

nn rn nrTi rmrrrr nrr AT AP^rATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


6720 


Db 


6661 


6720 


Qy 


6721 


C CT C GACCT CATCAAGACAGGGCGTTCAGT GGT GCT GACAT CACACAGCAT GGAGGAGT G 

| | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 

^m^Tx^rp r 7\ rvr a 7a r a r a r r ar CTT r Af^T HGT GCT GACAT CACACAGCAT GGAGGAGTG 


6780 


Db 


6721 


6780 


Qy 


6781 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 

I I I I | | | | | I 1 1 i 1 1 1 1 1 I 1 1 1 1 1 1 M 1 M I 1 ! 1 1 1 1 1 1 1 1 1 1 1 1 1 M I ! 1 i 1 1 M 1 I 1 1 

nr7X ^^ nrr m rTrr 7\nrr'r^rTf;firrATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6840 


Db 


6781 


6840 


Qy 


6841 


CATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTGCGGACCAAGAG 
| | | | 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 
r- ?\ m r r a r r a r r T r A A r A A r C GGT T T G GAGAT G GCT AC AT GAT CAC GGT G C G GAC CAAGAG 


6900 


Db 


6841 


6900 


Qy 


6901 


CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 
| | | | | | 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
PArpnarnrTrTr A Arr;APf;TGGTGrGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


6960 


Db 


6901 


6960 


Qy 


6961 


CAAGGAGCGGCACCACACAAAGGTGCAGTACCAbL I LAAb 1 L,bjb/\bb/\L,/\x ^ x bbb x 

I | ] | | | || | | | I I II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M M II II M 1 1 1 II 1 1 1 

CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 


7020 


Db 


6961 


7020 


Qy 


7021 


CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 


7080 



7021 



| | | | I M I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 

CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 



7 081 C AGC CAGAC C AC AC T GGACAAT GT GT T C GT GAACT T T GC C AAGAAG CAG AGT GACAAC CT 

|| M | | | M M I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I N 

7 0 81 CAGC CAGAC CACACT GGACAAT GT GTT C GT GAACTTT GCCAAGAAGCAGAGT GACAACCT 

7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 

| | | | | | | | | | | I I I I I I I I I I I I I I I I M M I I I I I M I M I I I I I I I I I I I I I I 

7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 

7201 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 

| | M | | | | | I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I 

7201 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 



7080 
7140 
7140 
7200 
7200 
7260 
7260 



7261 GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7320 

| || | | M || | || I I I II I I I II I I I II II I I I I I I I II M I I I I I I I I I 

7261 GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7320 



7321 



7380 



CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 

| | | M I I I 1 1 1 I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I II I I I 

7321 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7 3 8 0 



7381 



7440 



T GAC C AC CC AGAG C T G GG C C AG GGACT CAAC AAT GGGGAC AGAAGT C C C C C AGT G CCT G C 

MINIMI M II I I I I M I I I I I I I I II I I II Ill 

7381 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7440 



7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 

I | M I II I I M I I I M I I I I M I I I I I I II M I I I I I I I I I I I I M I M I I I I M 

7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 



7500 
7500 



7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

M M I M I I M I M I I II I I I M M II I I I II I II I I II M I 

7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 



7561 
7561 
7621 



GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 

|| II I II II I I I I M II I I II I II I I I I I I M M I I I II I I I M M I I I I II I M 

GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 



CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 

Mill | M I I I I M I I II I I I I M M II I I II I I I MINIM 

7 62 1 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 



7560 
7620 
7620 
7680 
7680 



7 681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 77 4 0 

| | | M II I I I I M M I I I I I M N I N N I M I I II I II I II M I I II M 

TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 



7681 
7741 



7740 
7800 



GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 

I I I I I I I I M I I I I I I I I I M I II I II I I M I M I M I II I MINI Ml 

7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7800 



7 801 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 

| | M | | | | M I I M M I I II II I II I II II I II M M I M II I M Mil 

7801 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 



7860 
7860 



7 8 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7920 
| | | | M || || II I M II I I II I I II II M II M I M M II II II II II II M M M II I I 



Db 7861 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7 92 0 



Qy 7 921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7 98 0 

| | | | I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I II I I I I I I I M I I I I II I I I I I I 

Db 7 921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 798 0 

Qy 7981 T GG GAG C C GGGC CT GT AC AT AG C GC AC AG AT GT TT GT T T T AAAT AAAT AAACAAAAT GT C 8040 

| | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7981 T G G GAG CCGGGCCT GT AC AT AGC G C AC AGAT GT T T GT T T T AAAT AAAT AAACAAAAT GT C 8040 



RESULT 2 
ABV74350 

ID ABV74350 standard; DNA; 8056 BP. 
XX 

AC ABV74350; 
XX 

DT 29-JAN-2003 (first entry) 
XX 

DE Human ABC transporter ABCA2 encoding polynucleotide SEQ ID NO 3. 
XX 

KW Human; ABC transporter; ABCB9; ABCBl; ABCA2 ; ABCG4; ABCG1; 

KW amyloid precursor protein; adenosine tri-phosphate; nootropic; 

KW ATP-binding cassette transporter; beta-amyloid plaque formation; 

KW Alzheimer f s disease; Parkinson's disease; Huntington's disease; 

KW gene therapy; transgenic; neuroprotective; anticonvulsant; 

KW antiparkinsonian; gene; ds . 

XX 

OS Homo sapiens. 
XX 



FH 


Key 


Location/Qualifiers 




FT 


CDS 


1350. .7364 






FT 




/*tag= a 






FT 




/product= "ABCA2 


ii 




FT 




/transl_except= 


(pos : 1437 . 


.1439,aa:X) 


FT 




/ trans l_except= 


(pos : 1557 . 


.1559,aa:X) 


FT 




/transl except= 


(pos : 1623 . 


,1625,aa:P) 


FT 




/transl_except= 


(pos : 1743 . 


.1745,aa:P) 


FT 




/transl_except= 


(pos : 1869. 


.1871,aa:G) 


FT 




/transl_except= 


(pos:2187. 


.2189, aa:X) 


FT 




/transl_except= 


(pos : 2497 . 


.2504, aa:AG) 


FT 




/transl_except= 


(pos:2781. 


.2783, aa:X) 


FT 




/transl_except= 


(pos:3024. 


.3026,aa:X) 


FT 




/transl except= 


(pos : 3108 . 


.3110, aa:G) 


FT 




/transl_except= 


(pos : 3246. 


.32 60,aa:NGHV) 


FT 




/transl except= 


(pos : 3351 . 


.3353,aa:P) 


FT 




/transl_except= 


(pos : 3444 . 


.3446, aa:V) 


FT 




/ transl_except= 


(pos:4020. 


.4022, aa:G) 


FT 




/transl_except= 


(pos: 4023. 


.4025,aa:G) 


FT 




/transl_except= 


(pos : 4047 . 


.4049, aa:G) 


FT 




/ trans l_except= 


(pos : 4098 . 


.4100, aa:H) 


FT 




/transl except= 


(pos:4197. 


.4199,aa:L) 


FT 




/transl_except= 


(pos : 4242 . 


.4244, aa:P) 


FT 




/transl_except= 


(pos : 4914 . 


.4916,aa:G) 


FT 




/transl_except= 


(pos:5010. 


.5012,aa:N) 


FT 




/transl except= 


(pos : 52 17 . 


.5219, aa:R) 


FT 




/transl_except= 


(pos : 5220 . 


,5222,aa:C) 



FT /transl_except= (pos:5223. .5225,aa:A) 

FT /transl_except= (pos:5766. .5768, aa:X) 

FT /transl_except= (pos:6306. .6308, aa:X) 

FT /transl_except= (pos:6420. .6422, aa:X) 

FT /transl_except= (pos:6525. .6527, aa:X) 
XX 

PN WO200264781-A2 . 
XX 

PD 22-AUG-2002. 
XX 

PF 08-FEB-2002; 2002WO-CA000138 . 
XX 

PR 09-FEB-2001; 2001US-0267975P . 

PR 31-JUL-2001; 2001US-0309256P . 
XX 

PA (ACTI-) ACTIVE PASS PHARM INC. 
XX 

PI Reiner PB, Connop BP, Pollard M; 
XX 

DR WPI; 2002-667006/71. 

DR P-PSDB; ABB98347. 
XX 

PT Regulating expression of amyloid precursor protein in a cell, useful in 

PT preventing or treating neurological disease, e.g. Alzheimer's disease, 

PT comprises regulating the expression or activity of an ATP-binding 

PT cassette transporter. 
XX 

PS Disclosure; Page; 78pp + Sequence Listing; English. 
XX 

CC The invention relates to regulating (Ml) expression of amyloid precursor 

CC protein in a cell, comprising regulating the expression or activity of an 

CC adenosine tri-phosphate (ATP) -binding cassette (ABC) transporter in the 

CC cell. (Ml) is useful for regulating expression of amyloid precursor 

CC protein in a brain cell to prevent or inhibit pathological beta-amyloid 

CC plaque formation in conditions such as Alzheimer's disease, Parkinson's 

CC disease or Huntington's disease. (Ml) is also useful in screening assays, 

CC predictive medicine (e.g. diagnostic assays, prognostic assays, 

CC monitoring clinical trials or phamacogenetics ) or methods of treatment 

CC (e.g. therapeutic, prophylactic, gene therapy) . The transgenic animals 

CC are useful for testing methods and agents as candidates for modulating or 

CC altering the ABC transporter-relates expression of amyloid precursor 

CC protein. The present sequence is that of an ABC transporter protein 

CC encoding polynucleotide of the invention. Note: The sequence data for 

CC this patent is not represented in the printed specification but is based 

CC on sequence information supplied to Derwent by the European Patent Office 
XX 

SQ Sequence 8056 BP; 1461 A; 2694 C; 2416 G; 1485 T; 0 U; 0 Other; 

Query Match 100.0%; Score 8040; DB 6; Length 8056; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 8040; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I | | I I I I II I I I I I I I I I I I I I I I I I I I I II I II I I i I I I I I M M M I I I I I I I I I I I 

Db 17 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 7 6 



61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 



77 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 136 
121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

| | I M I I I I I I ! I I I I I I I I I M M I I I I I I M I I I M I I I M I I I I I I M I I I I I I I I I 

137 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 196 

181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 240 

| | | || | | | | | I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

197 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 256 

241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

M II I II I II I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I 

257 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 316 

301 C AACT C C AC GGT C AC G CAGCT GCT T GAG C GC CT GG AC CGCGTGGTG GAG GAAG G C AAC CT 360 

| | I II I I I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

317 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 37 6 

361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 

I I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I M I I I I I I I M 

377 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 436 

421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 

| II I I I I I I I I I I I I I I I I II I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I 

4 37 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 96 

481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I INN 

497 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCA7\AA 556 

541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

| | | | | | | I I I I I I II I I I I I I I I I I I II I I I I I I I I I I M I M I I II I II I I I I I 

557 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 616 

601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

|| | | || I I I I I I I I I II I I I I I I I I I I I I I I M I I I II II I I I II I I M I I I I 

617 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 67 6 

661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

| II I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
677 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 736 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II M I I 

737 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 796 
7 81 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 

I | | | | | II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I MINI 

7 97 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 856 
841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

| || | | | | || | I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I I MINI 

857 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 916 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 
| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 


917 


Qy 


961 


Db 


977 


Qy 


1021 


Db 


1037 


Qy 


1081 


Db 


1097 


Qy 


1141 


Db 


1157 


Qy 


1201 


Db 


1217 


Qy 


1261 


Db 


1277 


Qy 


1321 


Db 


1337 


Qy 


1381 


Db 


1397 


Qy 


1441 


Db 


1457 


Qy 


1501 


Db 


1517 


Qy 


1561 


Db 


1577 


Qy 


1621 


Db 


1637 


Qy 


1681 


Db 


1697 


Qy 


1741 


Db 


1757 



917 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 97 6 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 102 0 

I I I I I I I | | | I I I I I I I I I I I I I I II I I I I I I I I I I M I M I I I I II I 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1036 

TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1096 

GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1156 

TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 

TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1216 

TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

| | I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 127 6 



CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 

| | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 

GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 

M | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 

CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 

| | | | M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 

C GAC C GC GT CAT C CT C AAG GC C AAC GAGACT T TTGCTTTTGT GGG C AAC GT GACT CACT A 
| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 

M I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I II I I I I I I I I I I I M I I I I I I I I I I I 
T GCCCAGGT CTGGCT CAACATCT CGGCGGAGAT CCGCAGCTTCCT GGAGCAGGGCAGGCT 

GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 

Milium 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 

GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 
ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 

M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II II 

ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 

CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 

1 I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I i I I I I I I I I I I I 
CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 



1320 



1336 



1380 



1396 



1440 



1456 



1500 



1516 



1560 



1576 



1620 



1636 



1680 



1696 



1740 



1756 



1800 



C C AGT T CAT GT C CAAGGT GAG C GT GG AC AT CT T C AAG GGCTTCCCC GAC GAG GAGAGC AT 

I || I I M I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I II I I M I I M II I I 

C C AGT T CAT GT C CAAG GT GAGCGT GGAC AT CT T CAAG GGCTTCCCC GAC GAGGAGAG CAT 1816 



18 01 T GT C AACT AC AC C CT C AAC C AG G C CT AC C AG G AC AAC GT C ACT GT T T T T G C C AGT GT GAT 1860 

I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I I I 

1817 T GT CAAC T AC AC C CT C AAC C AGGC CT AC C AGGAC AAC GT CACT GT T T T T G C C AGT GT GAT 1876 

18 61 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

| | | | | | | | | I I I II I I I I I I I I I I I I I II II I I I II I I M I I I I I I I I I II I I I I I I I I I 

1877 C T T C C AGAC C C G GAAGG AC G GC T C GCT C CC GC CT CAC GT GC ACT ACAAG AT C C GC CAGAA 1936 
1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

| | M I I I I I I I I I I I I I I I I I M I II I I I I I I M I I II I II II I I I I I I I I I I I I I I I I I 

1937 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1996 

19 81 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 204 0 

I | | | | | M II I I I I I I I I I II I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I II I 

1997 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2056 

2041 CGCC AT CAT C GACACT TT T GT GGGGCACGACGT GGT GGAGC CAGGCAGCT AC GT GCAGAT 2100 

| | | | | I I I M I I II I I II I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M 
2 057 C G C CAT CAT C GAC ACT T T T GT G G GGCAC GACGT GGT GGAGC CAG G C AGC T ACGT G C AGAT 2116 

2101 G T T C C C C T AC C C C T G C T AC AC AC G C GAT GAC TTCCTGTTTGT CAT T GAG CAC AT GAT G C C 2160 

I | | I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

2117 GT T C C C CT AC C C CT G CT AC AC AC GC GAT GACT T C CT GT T T GT CAT T GAG C ACAT G AT GC C 217 6 

2161 GCT GT GCAT GGT GAT CT C CT GGGT CT ACT C CGT GGCCAT GAC CAT C CAG CAC AT C GT GGC 2220 

| | || | | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 

2177 GC T GT GCAT GGT GAT CTCCTGGGT CT ACT C CGT G GC CAT GAC CAT C CAG CAC AT C GT GG C 2236 

2221 GGAGAAGGAGCAC CGGCT CAAGGAGGT GAT GAAGAC CATGGGC CT GAACAACGCGGT GCA 22 80 

| | | | || | | | | | || I I I II I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I 

2237 G GAGAAG GAGC AC CG G CT CAAGGAGGT GAT GAAGAC CAT G GGC CT GAAC AAC G CG GT GCA 2296 

22 81 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

| || | | | | | | | I I I I I I I II I I I I I II I I I I I I I I I I I I M II I I I III I I I I I I I II I I I 
2297 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2356 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 24 00 

| || || | | | | | | | | I I I I II I I II I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I 
2357 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2416 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 60 

| | | | | M | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2417 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2476 

24 61 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

| | | | || | || | | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2477 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2536 

2521 CAT GT AC GT G G C GAT C C GAG AGG AGGT GGC GCAT GAT AAG AT CAC G G C C T T C GAGAAGT G 2580 

I I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I 

2537 CAT GT AC GT G G C GAT CC GAGAGGAGGT GG C G CAT GAT AAGAT CAC G GC CTT C GAGAAGT G 2596 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2640 

| | I I M | I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
2597 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2656 



Qy 


2641 


TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 

| | | | M | | | | | M | I I 1 1 1 1 1 II 1 1 1 1 1 1 1 II II 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I 1 M II I 

— ^t. i ^^^rnr^nr' n a tvcr* A C^CCH Ar* ZiPrTTP APPP APrTPPPPPiPrTPipTAGGGpTGA 
TGAGGTGGCCGGCGTGGGCA1 GGAG1 GGGAGAGG1 1 L uon-uaoawi- 


2700 


Db 


2657 


2716 


Qy 


2701 


CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 
| | | | | | | | | | | | || I 1 1 1 1 1 II 1 1 1 II 1 II 1 1 1 1 1 1 M II 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 

^/^Ti^mmriT\ 7\ rrn m r* r*rn r* r>rn r* r* r*W f^T 1 C A C* C A T 1 C C T C A T P PT PPAPPPPPTPPTPT ATPPPAT 

CGACTTCAACTTGCTCCTGGC1 Gi LALLAl GGl GAlGbri kj\jj\^kd\-,^\3 ± \jkj i ^ j-^-vi vjujwvj- 


2760 


Db 


2717 


2776 


Qy 


2761 


CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 

| | | | | | | | | | | | | | I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 

__ m ^^^^ m «^ m ^^ 7vrn rn/-*7\ / r. rr .fyi^m^f<7\pf-'pArrrflTr r f 1 Q PPPPPT PPPPPPPPP.PTPPT A 
CCTCACGTGGTACATTGAGGCI Gl GCAGGGAGGGAl gi AGbrtjtj^i bLoo^^uL,^ ± 


2820 


Db 


2777 


2836 


Qy 


2821 


CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 
| | M 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

— mms^^s-i-K /-* m /—> tv /~* 7\ 7\ r*rr\ r* r*rn 7\ r* C r"T> C* C* C C* A fT C C P P CC A P A P A A PPPTPPtPtAPtTPPtAG 

CTTCCCACTGCAGAAGTCCI AC1 GGG 1 GGGGAG1 bbb^bb/iL/ib/V\ij0^l \j\j\3S^j l kjkjtwj 


2880 


Db 


2837 


2896 


Qy 


2881 


CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 
| | | | | | | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CTGGCCGTGGGCACGCACCCCCCGCCTCAGI Gl CA1 bbAbb/itjbAULAbbLL i bi <j^utt.± 


2940 


Db 


2897 


2956 


Qy 


2941 


GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 

IN M 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 II M 1 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCAl bbAbbAbbAbLbL./\bLbAbb i i ^ i 


3000 


Db 


2957 


3016 


Qy 


3001 


GGT T GT CT GCGT G GACAAACT C AC C AAG GT CT ACAAGGAC GACAAGAAGCT G GCC CT GAA 

| | I I I I I I 1 1 1 I 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 

GGTTGTCTGCGTGGACAAACTCACCAAGG1 L 1 Ab AAbbAL bAb/v\b/\rtbb i kjkj^k^^i 


3060 


Db 


3017 


3076 


Qy 


3061 


CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 
| | | II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 M M 

_ ^ _ ~ ~rn*-*K j^mn-K 7\ r*S>mr<rn-r\ r-r^fTi A C A C f^T C H*V C* PT T PTT PPPP P A P A A P PtPPtGP 

CAAGCTGAGCCTGAACCTCTACGAGAAGCAGGl GGi blbbi i Li i k^^^^/v^tt/v~ovjovj^ 


3120 


Db 


3077 


3136 


Qy 


3121 


GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 

| || | | | | | | | | | I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 H 1 1 1 1 1 1 1 1 

GGGCAAGACCACCACCATGTCCATCCTGACCGGGG1 Gl l bbb 1 btAAbb l bbbb 1 1^^^^ 


3180 


Db 


3137 


3196 


Qy 


3181 


CACCAT CTACGGGCACGACAT CCGCACGGAGATGGATGAGATCCGCAAGAACCT GGGCAT 

Ill MINIUM MINIMI IIIININ 

CACCAT CTACGGGCACGACAT CCGCACGGAGA1 GGA1 GAGA1 LbbbAAb/v\bb i bj<jvj^n.x 


3240 


Db 


3197 


3256 


Qy 


3241 


GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 

| || || || N 1 1 N 1 N 1 1 II II 1 II 1 II II II II II II N N II 1 II 1 N 1 

GTGCCCGCAGCACAATGTGCTCT 1 1 bALLbbb 1 LAbbb i bbAbbA/\babb i b i u^i x^±n 


3300 


Db 


3257 


3316 


Qy 


3301 


CT C AC G G CT C AAGAG C AT GGCT C AGGAG GAGAT C CG C AGAGAGAT GGAC AAGAT GAT CGA 

|| || || II II II II II 1 II II II II II 1 II II II II 1 II 11 II 1 1 II 1 N II 1 

/ , m -, _ _ „,^ m ,^,, rr-^mrrpmr' a re a rr a r" a. TP PHP A P A PAP ATPPAP A APATGATCGA 
C T C AC GGCT C AAG AG CAT GGG 1 GAGGAGGAGAl ^L.br^AbjA^/vj/\± ^w-v 


3360 


Db 


3317 


3376 


Qy 


3361 


GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 

| | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

— ^1 i-pi /-« /-+ -K ^^.m^rp^^ A 7\ 7v 7\ a rrp a r*T" r 1 a r^TrzCT PP AP AP ATTPTPPPPTPPCATGAA 
GGAC CTG GAG CT CT C CAACAAAC GGGAG 1 LAbibbi ^^a^j/i^jh.i i ^^^^1 o^wt-j. vjj-w-v. 


3420 


Db 


3377 


3436 


Qy 


3421 


GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGAGGA 

1 II 1 II N II 1 II 1 1 1 1 N II N II 1 II N 1 N 1 1 1 1 1 1 1 N II N 1 II N 1 II 1 

GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 


O40U 


Db 


3437 


3496 


Qy 


3481 


GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 


3540 



I I I I I I II I I I I I I I I I I I I I II I I I I I I I I II MINIM 

3497 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3556 
3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

M M I M II M M II I II II II I II I I MMMI I 

3557 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3616 
3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I II I I II I I I MINIM I I MIMIII 

3617 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3676 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

| II II I II I II II II II I I II II II I I I II II II II I I II 

3677 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3736 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I II II II II I II II I I M MIMMMMIM MMMI 

3737 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3796 
3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I II I II II II II M I II II II II II M I II II II I II II II II M I II II II M 

3797 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3856 
3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

II II II II I II II II I II II II M I II II II M MUM 

3857 AGACACAAGCACGGAGCT CTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3916 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

|| || | || || II I M M I II I I II II II I I I II II M II II M M II II II II I 

3917 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 397 6 

3961 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4020 

| | II I II II II I II II II I II I I M II II II M I M MM 

3977 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4036 

4021 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4080 

I | || || | || | || II I I II II II II II I II M I M I I M II I M II II II I II M II I I M 

4037 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4096 

4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

| | | | | | || | M I II II I II I I M II II II II II I I II II II II I II I II II II M II II I 
4097 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4156 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

| | I 1 I I I I I I i I I I I II I I II It I II I M I II I I M I I 1 1 I I M I I I II M I 

4157 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4216 

42 01 CTACACCGACGTCTATGGCGACTACCGCCCCCT CTTT GAT AAC C C AC AG G AC C C AG AC AA 42 60 

| | | | || || || || II II M II M I M M II II II I I I I II I M I II I I II II M II II II I 
4217 CTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCAGACAA 427 6 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

| | | | | M || II II II II M I II I M II I I II II II II II II II M II II II II II M I M 
4277 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4336 



4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

| | M M I I I II II I II II II II II I I M I II I I I I II I II I I M I II I I II I I I II I I I I 



4337 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 43 96 
4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4440 

I | | | | | | | | I I I I I I I I I I I I I I I I M I I I I I I I I I I I I M I I I 

4397 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4456 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

| | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4457 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4516 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I N I I I I I II 

4517 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4576 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

| I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

457 7 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 636 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

Ml | | | I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I II I I I I I 

4637 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4696 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

| | | | | | | I M I I I I I I I I I II I I I I I I I I I I I II III I I I I I I I I I I I I 

4697 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4756 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

| | | | I I I I II I I I I II I I I II I II I II I I I I I I I I I I I I I I 

4757 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 816 

48 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 8 60 

M II I I I I I I I II I I I I I I I I II I I I II III I I I I 

4817 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4876 

4861 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

M I II I I I I I I I I I I II I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I II 

4877 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 936 

4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4980 

| | | | | | | | | | | | M I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I 
4937 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4 996 

4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

M | M I I I I I I I I I I I I I I I I I II I II I I II I I I I I I I I I I I I I I I I I 

4 9 97 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5056 

5041 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5100 

I I I I I I I I I I I I I I I I I I I I I I I II M I II II I I I I I I I II I I I I I I I I 

5057 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5116 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

| II I I I I I I I I I I I I I I I I I I II I I I I II I I I I I II I I I I I I I I I I I I I I I I III I I I I I 
5117 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5176 

5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

5177 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5236 



5221 GGT T T T CT ACAACAAC AAG G GCT AT CACAGC AT G C C CAC CT AC CT CAAC AG CCT CAACAA 52 8 0 

I I I I I I I I I I I I II I I I I I I I M I I I I I I I II I I I I I I I I II I I M I I I I I I I I I II I M 
5237 GGT TT T CT ACAACAACAAG G G C TAT CACAGC AT G C C CAC C T AC CT CAAC AGC C T CAACAA 5296 

52 81 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

| I M I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

52 97 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5356 

5341 C G T CAC CAAC CAC C C CAT G AAT AAG AC C AG C G C C AG CCTCTCCCTG GAT T AC C T G C T G C A 5400 

| | | | | | | I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
5357 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5416 

54 01 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 54 60 

| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
5417 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 547 6 

5461 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 552 0 

| | | | | I II I I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
547 7 CTT CGTT GTCTT CCT CGTGGCCGAGAAGT CCACCAAGGCCAAGCATCT GCAGTTTGT CAG 5536 

552 1 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 558 0 

|| | | | | | | || I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I 

5537 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5596 

5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

| | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I 
5597 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5656 

5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 57 0 0 

I M | | | | | II I I I I I I I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I I I I M I II I I I 

5657 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5716 
5701 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

| | | I I I I I I I I I 1 I I I I I I I I I I I I t I I I I I I I 1 I I I I I I I I M I I i I I i I I I I I M I M 

5717 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5776 

5761 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

|| | | | | I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I M 

5777 T GT CAT CAAT C T CT T CAT C GGC AT CAC C G C CAC C GT G G C CAC CTT CCT GCT AC AG CT CT T 5836 

5821 C GAGC AC GAC AAGG AC CT GAAG GT T GT C AAC AGT T AC C T GAAAAG CTGCTTCCT CAT T T T 5880 

| M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5837 CGAGCAC GACAAGGAC CT GAAG GT T GT CAAC AGT T AC C T GAAAAGCT GCT T C CT CAT TT T 5896 

5881 C C CCAACT ACAAC C T G G G C CAC G GGCT CAT GGAGAT GG CCT ACAACG AGT AC AT CAACGA 594 0 

|| || || | | || I I I I I I I I I I I I I I I I I I I I II M I I M I I I I I I I I II I I I I I I I M M I 
5897 CCCCAACTACAACCTGGGCCACGGGCT CAT GGAGAT GGCCTACAACGAGTACAT CAACGA 5956 

5941 GT AC T AC GC CAAGAT T G G C C AGT T T GAC AAG AT GAAGT C C C C GT T C GAGT GG GAC AT T GT 6000 

M | || || I I I I I I II M I I I I I I I I II I I I I I II I I I I I I 

5957 GT ACT AC GC CAAGATT G GC C AGT T T GACAAG AT GAAGT CCCCGTTC GAGT GG G ACAT T GT 6016 

6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

|| | | | I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I M I I I I I I I I I I 

6017 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6076 



A.. 

Qy 


DUDl 


GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 

| | | | I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 

Grace AGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 


6120 


DO 


£077 


6136 


Qy 


£1 91 


GGAT GAT GT G GAC GT G G C C AGT GAG C GG C AGC GAGT GCTCCGGG G AGAC G C C GAC AAT GA 

I I I I I I I I I 1 I 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 

PGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGA 


6180 


UD 


Dl J / 


6196 


Qy 


Dl O 1 


CAT GGT C AAGAT T GAG AAC C T GAC C AAG GT C T AC AAGT C C C GGAAGAT T GG C C GT AT C C T 

I 1 M II 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 

r AT G G T C AAG AT T GAG AAC C T GAC C AAG GT C T AC AAGT C C C GGAAGAT T G G C C GT AT C C T 


6240 


UD 


Dl J / 


6256 


Qy 


£9 d 1 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 

Ml | I I I I 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

rrr TGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 

\j \j K^, \j X X uAv v. • vj v» v> x vj X Vj w v«» x \j \j sj x vj x >j v^ vj -w « -w - — — 


6300 


Db 


£9 R7 
bZ 0 / 


6316 


Qy 


too U 1 


CAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGG 

I I I I I 1 1 1 1 1 I I 1 1 1 1 1 1 II II 1 1 i 1 i 1 M M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 

r AArrrTnrnGGrAAGArrAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGG 


6360 


Db 


/TO i n 

tool / 


6376 


Qy 


too tol 


GGGCGAGGC CTT CGT C AAT GGACACAGCGT GCT GAAGGAGCT GCT CCAGGT GC AGC AGAG 

i 1 1 1 ii 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 ii 1 1 1 mill! 

rr rrr; At^GrrTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 


6420 


TAT 

Db 


too / / 


6436 


Qy 


6421 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 

1 1 1 1 I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 

rrTrrrrT ArTGrrrGrAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 


6480 


Db 


b4o / 


6496 


Qy 

Db 


b4o 1 
£/1 Q 7 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 

1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

rr ArPTGTArACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 


6540 
6556 


Qy 


6541 


G G CT CT GGAGAAGCT G GAGCT GAC CAAGT AC GC AGAC AAG CCGGCTGG C AC CT AC AGC G G 

| | | | | | | | | | I I 1 II 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 

rrrTr Tr r:A(^ A AGrTGGAGCTGAC CAAGT ACGCAGACAAGCCGGCTGGCACCTACAGCGG 


6600 


Db 


OOJ / 


6616 


Qy 

Db 


b to U 1 
bbl / 


CGGCAACi^AGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 

| M | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

rrrr A ap AAGrGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 


6660 
6676 


Qy 


to to to l 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 

M | I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II II II 1 1 1 1 1 Ml 

rrTr^ArGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


6720 


Db 


£ £7 7 

to to / / 


6736 


Qy 


£791 

to / z i 


CCTCGACCTCATCAAGACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTG 

| | | | Ill II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 II 

rrTCRACCTCATCAAGACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTG 


6780 


Db 


£7 ^7 

to / o / 


6796 


Qy 


b / o 1 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 

| | | I I 1 1 1 1 1 1 1 II 1 I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 

rGAGGrGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6840 


DO 


£7 Q7 
b / :? / 


6856 


Qy 


6841 


^^.tv /N/Mm^Tv a r"7\ a r^r^r* r'TT'Trr' ar aTfCPTar ATCATP APrrGTGCGGACCAAGAG 

CAT C C AG C AC C T G AAO AAL Lbbi 1 1 \j{j/\\j/\L bbLln^/ll v7/\l ^rt^b^ 1 u O un.^ ^ru-i^i-ivj 

I I | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 

CAT C C AG C AC CT GAAGAAC CG GT TT GGAGAT G GCT AC AT GAT CAC GGT GC G GAC C AAGAG 


6900 


Db 


6857 


6916 


Qy 


6901 


CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


6960 



Db 


6917 


1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 
- 7 . r «^ 7 . ^7v^r T i^^r'7\7\rrarrTrr; r T i r:rr;r;TTrTTrAACCGCAACTTCCCGGAAGCCATGCT 

C AG C C AG AG T C* 1 b AAb O-M-O 1 LjO lO^yuJ. 1 O 1 J- ^r^r\\^ ^ x x vv^^^-i " iw 


6976 


Qy 


6961 


CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 

^ * 7v ^ ^ r* r* r r n t\ r* n 7a ra r a a a r cjv cr A A C c AGCT CAAGT CGGAGCACAT CT CGCT GGC 


7020 


Db 


6977 


7036 


Qy 


7021 


CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 

| | I I | I I I 1 1 1 1 1 1 1 1 II II I I I 1 1 I 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

_ _ ^ ^ „ „„„ ~ 7. ~ p. r tv m r r a rr t\ r^T^TrTnGrGTGCTGGGCATCGAGGACTACTCGGT 

CCAGGT Gil bAo"bAAbr.r\l ounu^n.uo lul^l uu^ui x uuuv/m ^ '•^ 


7080 


Db 


7037 


7096 


Qy 


7081 


CAGCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCT 

| | | | | | | | 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

«*^r<Ar'7\prTirrAraATrTr r P r T i rr r ?rz\arTTT^rrAAGAAGCAGAGTGACAACCT 
C AG C C AG AC C AC AC i GGACAA1 b 1 b 1 lUbi LxHMO 1 1 1 vj\^\^rt^vj.ru^o^r^var-i.\j x wx vn.^v- x 


7140 


Db 


7097 


7156 


Qy 


7141 


GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 

| | | | | M | | | | I I 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 

^^T\PP7sr^7vrrAraprrarrrrrrz\Trrf;rArTf;rAGTCCCCTCTCGGCTGCTTGCTCAG 
GGAGCAGCAGGAGACbbAbbbbbb/\i oo^^/^ i b^rtu i v^u^u i u i ^vjuv j. w a j. w j. >. 


7200 


Db 


7157 


7216 


Qy 


7201 


CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 

| | | | | | | | | | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

« rt mo^mnr.^r<^r<ri^rrmpmrpr i r , pr]\rrr2irr ,f rrr^nrAr'TTnTGGCAGACGAGCCCGA 
CCTGCTCCGGCCCCGGTC T bL O L L L bbAbL 1 LLbbbk/A^ l l oi 


7260 


Db 


7217 


7276 


Qy 


7261 


GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 

| | | | | | | | | | | I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 

^^-.^-.-n---, r*^r'^r*7\r<r*7\r>r*7\rrrr'r r rrA r vr&GrT r VCG7\GGAGGAGCGGGCCCAGC r TGTC 
GGACCTGGACACGGAGGAObAbbbCb 1 LAi bAbOl 1 lanu^uuu^^^jiu^ x ^. j. ^ 


7320 


Db 


7277 


7336 


Qy 


7321 


CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 

M | | | | | I I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 'I 

^rnm^y, * -» ~ r* ~ 7. r* 7, n <-* prTi pm r r a r r A r r r A G A nrTf^f^GrCAGGGAGGACACGCTCCAC 
CTTCAACACGGACACGC 101 GL 1 b Ab LAO o o/\o/-u^ o i x ^^>i ^ 


7380 


Db 


7337 


7396 


Qy 


7381 


T GAC C AC C C AGAGCT GGGC CAGGGACT C AACAAT GGGGAC AG AAGT C C C C C AGT GC CT GC 

| | | | U 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 

m^Tv^nTi^^r«7ir7\rr'fTirrrrr7\rrrarTraarz\aT^f;flArAGAAGTCCCCCAGTGCCTGC 
TGACCACCCAGAGCTGGGOCAbbbAbl. ookjbJjA^/^?i^ruji ^^^u^nvji vj^^x \~>^ 


7440 


Db 


7397 


7456 


Qy 


7441 


CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 

| | | I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

^ 1 v^^^r.r'm^r'7vrmr'r7\rrmmr , flrr7ArrziArr:r;r;rTTrTnGTrCTCCAGCCCCTGTACTCG 

C AG G G C C T G GAG T G GAG Gil LAbbALLAAbbbbL 1 Itl bbl v^^i ^^nou^uvvi Uin ^ ± ^ 


7500 


Db 


7457 


7516 


Qy 


7501 


GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 

| | | | | | || | | | || I I I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 

^^^ivm^n^r«mrprprnr'7\pmrrrr r r r rr , r , pr , rrrr r PAATTriTrirrAAAGGCTGACCCGGCCC 

GCCATGCCCTGCGG1 CAb 1 bbbbl 1 bbbbLLLUlAftl ibi u^^nnnau^i un^v/vuw^w 


7560 


Db 


7517 


7576 


Qy 


7561 


GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 

| | | | I I I 1 1 1 1 II II 1 1 M 1 1 1 II 1 1 1 1 1 M 'I 1 1 N I' 1 1 1 1 

p^p^mrr i r , rr7\r7\r , rprr'T i rr , r , r r rrr f T 1 T r rrrrTTAAArjrrTrGGGGTCTGCCCGGCCCCTCG 
GGGCTGCGTACACCC 1 1 bLLL 1 bbl i 1 bLti i/v-wAbrv^i ^wjui ^x u^wvvvjvj^^^^i ^ 


7620 


Db 


7577 


7636 


Qy 


7621 


CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 
I I 1 1 1 1 II 1 1 1 1 1 1 1 II | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CCCCTGCCT GGC AC IbL 1 LALbbbbbAftbObbAvvU^^iJO^ I uun^wrvuvjv/riv x x ^ ^ 


7680 


Db 


7637 


7696 


Qy 


7681 


TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 

I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

' TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 


7740 


Db 


7697 


7756 


Qy 


7741 


GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 
I I 1 I 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 


7800 



Db 


7757 


Qy 


7801 


Db 


7817 


Qy 


7861 


Db 


7877 


Qy 


7921 


Db 


7937 


Qy 


7981 


Db 


7997 



GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 



| | | 1 I 1 I M I I I I II I I II II II I I I I I M I M Ml II Ml I MMMMM 

CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 
CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 

| | | | | | | M I I I M I II I M I I I I M I I I I II II M II I I I M I II I I I M M I I 

CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 



7816 
7860 
7876 
7920 
7936 
7980 



CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 

I | | || | || || | I II I I I I I I I M I I II I I M I M I I I II I M I I I I II I I I I I M II I M 

CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7996 



8040 



T GGGAG CCGGGCCT GT ACAT AGCG CAC AGAT GT T T GT T T T AAAT AAATAAACAAAAT GT C 

I | M I I M I I M I I I I I I I I I I I I I I I I II I I I M I I M I I I I I I I I I 

T GGGAGC C GG G C CT GT ACAT AGCG CAC AGAT GT T T GT T T T AAAT AAAT AAACAAAAT GT C 8 056 



RESULT 3 
ABL53009 

ID ABL53009 standard; DNA; 8269 BP. 
XX 

AC ABL53009; 
XX 

DT 06-JUN-2002 (first entry) 
XX 

DE Human ATP binding cassette transporter protein, ABCA2 , coding sequence. 
XX 

KW Human; ABCA2 ; gene; neuroprotective; nootropic; antiparkinsonian; 
KW adenosine triphosphate binding cassette transporter protein; 
KW ATP binding cassette transporter protein; Alzheimer ! s disease; 
KW prion disease; Huntington 1 s disease; Parkinson 1 s disease; ds . 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 250. .7560 

FT /*tag= a 

FT /product= "Human ABCA2" 

XX 

PN WO200208424-A1. 
XX 

PD 31-JAN-2002. 
XX 

PF 26-JUL-2001; 2 001WO- JP006457 . 
XX 

PR 26-JUL-2000; 2000 JP-00225462 . 
XX 

PA (BANY ) BANYU PHARM CO LTD. 

PA (INAG/) INAGAKI N. 

XX 

PI Inagaki N; 
XX 

DR WPI; 2002-179907/23. 
DR P-PSDB; ABB76715. 
XX 



PT Adenosine triphosphate (ATP) binding cassette transporter gene ABCA2 of 

PT human or rat origin and encoded protein, useful for screening inhibitors, 

PT promoters and regulators of ABCA2 activity as drugs and diagnosis of 

PT ABCA2-related diseases. 
XX 

PS Claim 2; Page 47-52; 118pp; Japanese. 
XX 

CC The present sequence is the coding sequence for human adenosine 

CC triphosphate (ATP) binding cassette transporter protein (ABCA2) . ABCA2 

CC can be used in the diagnosis, treatment and prevention of diseases such 

CC as Alzheimer's disease, prion diseases, Huntington's disease, and 

CC Parkinson's disease 

XX 

SQ Sequence 8269 BP; 1525 A; 2724 C; 2469 G; 1551 T; 0 U; 0 Other; 

Query Match 100.0%; Score 8036.4; DB 6; Length 8269; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 8037; Conservative 0; Mismatches 1; Indels 0; Gaps 0; 

GCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGC 62 

| | | I I I M M I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I M I I I I II I I I I I I I 

GCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCTGC 277 

TGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCT 122 

| I I I I I I Ill MM M I I I I I II I I I M M M 

TGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGATCT 337 

TCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCT 182 

| | | | | | | I I I M I I I M I I I I I I I I I I I I M I I I I I I M I I M I I I M I I I II I M I I I I 
TCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCATCT 397 

CCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTG 242 

I | | M I II M I I I I M I I I I I M M I I II II II I I II II I I MM 

CCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCCTG 457 

TCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCA 302 

Ml M II I I M I II I M M M I I I II II II II II I I I II II I 

TCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGCCA 517 

ACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGT 362 

M I II I II II I II II II II I M II M I II I II I 

ACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCTGT 57 7 

TTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGG 422 

| || I I II I II II II I M II I I I II II M I M I M II II I M M I M 

TTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGAGG 637 

CCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCT 4 82 

| M I I I I M I M II I II II I II I I I I I I I I I I I I I I I M II I I I I I I M II I I I I I I M I 

CCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTCCT 697 
TCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACT 54 2 

I | I I I II II M I I II II M II I II II II II II II I II M II II M II II II II II M I II 

TCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACT 757 



QY 


3 


Db 


218 


Qy 


63 


Db 


278 


Qy 


123 


UJJ 


338 


Qy 


183 


Db 


398 


Qy 


243 


Db 


458 


Qy 


303 


Db 


518 


Qy 


363 


Db 


578 


Qy 


423 


Db 


638 


Qy 


483 


Db 


698 



Qy 



543 TGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGG 602 

I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 



758 TGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGG 817 



603 TCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGG 662 

| | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I I 
818 TCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGG 877 

663 GTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGC 722 

| | | | | | | | | | M I I I I I I I M I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I 
878 GTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGC 937 

723 TGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGA 7 82 

| | M | I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

938 TGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGA 997 

7 83 TCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCA 8 42 

| | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

998 TCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCA 1057 

843 GTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACC 902 
| | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1058 GTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACC 1117 

903 AGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGACT 962 

| | I I I I I I I I I II I I I I I I I M I I I I II I I I I II I I I I I I I I I I I I I 

1118 AGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGACT 1177 

963 CCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATG 1022 
| M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
1178 CCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGATG 1237 

1023 CCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGG 1082 

MM I I I M I I M I II II II I I I I M II I I I M I M 

1238 cCC*™^™^^™^ a ^ T ^ aTCTrrTaTnRRrc ^ 1297 



I I I I I M I I I I I I I I I I I I I M I l l M I i i i i 

XAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCAGG 

GTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCA 
|| II II II I I I I M I M I I II II I I II I I M I I Ml II 



1298 GTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAATG 1357 

1143 GCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTG 1202 

| M I I I II I I I M I I I I I I I I I I I M I I N I II I I II II I I I I II I I 

1358 GCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTCTG 1417 

1203 CTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCT 1262 

| | | | | I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
1418 CTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCTCT 1477 

1263 GGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGC 1322 

M Ml I I II II I I I I I M I II M I I I II I I II II II I I 

147 8 GGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCTGC 1537 

1323 GGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCC 1382 

|| || | II II II I II II I I I I I I II I II II I I II II I I II I M M II II II M II II I I M 
1538 GGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCTCC 1597 

1383 TCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCG 1442 

M I II I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 1 1 

1598 TCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGTCG 1657 



1443 ACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATG 1502 

| | | | I I | I I I I I I I I I II I I I I I I I II I I I I I I I I I I I II I I 

1658 ACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTATG 1717 

1503 CCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGC 1562 

| | | | | I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1718 CCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCTGC 1777 

1563 AGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCAC 1 622 

| | I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

1778 AGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGCAC 1837 

1 623 TGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCA 1682 

| I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I 

1838 TGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCCCA 1897 

1683 GTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCC 1742 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1898 GTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGATCC 1957 

1743 AGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCATTG 1802 

| | | | M I I I I I I I I I I I I II | | I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

1958 AGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCATTG 2017 

1803 TCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGATCT 1862 

| | M Ml II I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I 

2 018 TCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGATCT 2 077 

1863 TCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACT 1922 

| I I | | | M I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2078 TCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACT 2137 

1923 CCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATA 1982 

| | | I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I 
2138 CCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATA 2197 

1983 CTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCG 2042 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
2198 CTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCG 2257 

2043 CCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGT 2102 

| 1 | | | I | | M I I I I I I I I I I II I I I 1 I I I I I I I I I I I I I I I I I I II I I I I I I 

2258 CCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGT 2317 

2103 TCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGC 2162 

| | | | | | | | | | | | | | | | | I I I II I I I J I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I 
2318 TCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGC 2377 

2163 TGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGG 2222 

| | M I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

2378 TGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGG 2437 

2223 AGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACT 2282 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
2438 AGAAGGAGCACCGGCTCAA.GGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACT 2497 



Qy 




GGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCG 

| | M | | M | 1 M I 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 

rrrvr rrrTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCACCG 


2342 


DO 


o /i no 


2557 


Qy 




CCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCC 

| | | | | | | I I I I I I 1 1 1 1 II II 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 

f-raTrrTrAA^TACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCC 


2402 


Db 


ZJJO 


2617 


Qy 




TGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCA 

|| I I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 M 1 1 1 M 1 II 1 

Trrr ATT fT AC GCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCA 


2462 


Db 


Z t)± O 


2677 


Qy 


Z 4DJ 


AGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACA 

I I I I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

arrrr a arrTf^f^rrTPKGrrTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACA 


2522 


Db 


z 0 / 0 


2737 


Qy 


2523 


TGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTGCA 
| | | | | | M M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
<v r rr a r r t r r r r at r r a A A^n AGGTGGC GCAT GATAAGAT CAC GGCCT TCGAGAAGT GCA 


2582 


Db 


0100 
z /io 


2797 


Qy 

Db 


0 c 0 0 
zoo 0 

O 1 Q Q 

z / y 0 


TCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATG 

I I I I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 Mill 

Tr rrrTrrrTrATf^TrrArGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATG 


2642 
2857 


Qy 


z o4 0 


AGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACG 

I | | | I I M M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 

Arr^rr rrrr^r r;T^n^rATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACG 


2702 


Db 


z 0 0 0 


2917 


Qy 


z / U J 


ACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCC 

1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 Ml 

ArTTPAArTTnrTrrTGGrTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCC 


2762 


Db 


OQ1 Q 

z y 1 0 


2977 


Qy 


z / bo 


TCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACT 

| M II 1 II 1 1 1 M II II II II II 1 II II 1 M 1 II 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 M 1 1 

TrarrTrrTAPATTnA^GrTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACT 


2822 


Db 


z y / b 


3037 


Qy 


0000 

zozo 


TCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCT 

| | | | | | | M I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 'Ill, Ml 

rrrrrnrTrr at AAf^TrrTArTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCT 


2882 


Db 


0 n 0 0 

303o 


3097 


Qy 


Zooo 


GGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGG 

| | | | || | || | M 1 II M 1 M 1 M M 1 II II II 1 II M 1 1 II II II II 1 II 1 1 1 M 

rrrrrTrrrrAr^P AC rrCTGGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGG 


2942 


Db 


Q ft Q Q 


3157 


Qy 


zy 4 0 


AGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGG 

| | | || || | || || | M II 1 II II II II 1 1 II 1 M II 1 1 1 1 II II 1 1 M M 1 M M 1 1 M M 
ac ArrrrrrrrTTTfiA^GAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGG 


3002 


Db 


■31 CO 


3217 


Qy 




TTGTCT GCGT GGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCT GGCCCTGAACA 

| | | | | | | | | I I I I I 1 1 I 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

r r r vr r rr r vrrr r vnnArAAAC r VC ACCAAGGT CT ACAAGGAC GACAAGAAG CT GGC C C T GAAC A 


3062 


Db 




3277 


Qy 


3063 


AGCTGAGCCTGAACCTCTACGAGAAULAbbl (abx CX L.ux ili x ^^L7^^/\l./v^^\j^o^\^oo 

| | | | | | | | | | II M II 1 II II II II 1 1 1 1 II II II II II II II 1 II 1 M M 1 1 M M 1 M 

AGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGG 


3122 


Db 


3278 


3337 


Qy 


3123 


, GCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCA 


3182 



[ I I I I M I I I I I 1 1 I I I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I M I I 

3338 GCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCA 

3183 CCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTGGGCATGT 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3398 CCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTGGGCATGT 

3243 GCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACT 

| | | | | | | | | | | I I I I I I | | I I M I I I I I I I I I M I I I I I I I I I I I I M I 

3458 GCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACT 

3303 CACGGCTCAAGAGCATGGCTCAGGAGGAGATCCGCAGAGAGATGGACAAGATGATCGAGG 

| | | | II I II I II II II I I I M I I M II I I I I I I I M I 

3518 CACGGCTCAAGAGCATGGCT C AG G AGGAGAT C C G C AGAG AGAT G G AC AAG AT GAT C G AGG 



3397 
3242 
3457 
3302 
3517 
3362 
3577 



3363 ACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGC 3422 

| | M | | I I I I I III I I I II II M I I I I I I I II I I 

3578 ACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGC 3637 



3423 GCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGC 3482 

| | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3638 GCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGC 



3483 CCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACA 

| | | | | | | | | | I II I I I I I I I M I I Ml Ml I 

3698 CCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACA 



3697 
3542 
3757 



3543 AGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGG 3602 

| | | | | | | | | | | | | I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I II 

3758 AGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGG 



3603 ACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCA 

| | I I I I I I I I I I I Ml I I M I I I I II I I I I I I I M II I I I I I I I II I II I I I 

3818 ACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCA 



3817 
3662 
3877 



3663 AGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGG 3722 

|| || | || || || II M M M II II M M II II M M M M M II I II I M M M II I I I M 
3878 AGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGG 3937 

3723 GCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCT 3782 

I | M I II I I I I I I M I II I I I II M II II II II II M II II II II II M II I M II II II 

3938 GCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCT 3997 



3783 CCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAG 

| | II I I I I I II II II I I II II II I II I I I M M II II 

3998 CCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAG 



3842 
4057 



3843 ACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCG 3902 

|| || || || || II I I I II I I II II II II M II II I M II II II II M I M M I M II I II I 
4058 ACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCG 4117 

3903 AGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGC 3962 

| || | || | || II I I I II I II II II M II I II I I I II I I I II 

4118 AGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGC 4177 



3963 TGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCTGG 4 022 
I I I I I I I I I II I II II II II II II II II II I I M II II II II M I M M 



4178 TGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCTGG 



4023 AGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCC 4082 



I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M 1 1 IlliiiiiiiiiiiiiiiliiiU 

4238 



AGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCC 4297 



4083 CGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGC 4142 



I | | M | | | | I I I I I II I I I I I I I I I I IN I M IN [III I I I 

4298 



CGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGC 4357 



4143 AGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCT 4202 



4418 
4263 
4478 
4323 
4538 
4383 
4598 
4443 
4658 
4503 
4718 
4563 
4778 
4623 



| | I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGui 

ACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCAGACAATG 

| | I I I I I I I I I I I I I M I I M I I I I I I I I II I I I I I I I I I I I I I I I I I 

ACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCAGACAATG 



4477 



TCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGC 4322 

| | I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

TCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGC 



TGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACT 

| | | | | | | | | | | || | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

TGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACT 

GCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCT 

| | I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCT 



4537 
4382 
4597 
4442 
4657 
4502 



GCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCC 

M | I | M I I 1 I M I I 1 I I I M I I I I I I I I M I I I I I I I 1 I I I I I I II I I I I I I I 

GCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCC 4717 

TGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCA 4562 

| | | | | 1 | I I 1 1 I I I 1 1 I I I t I I I I I I I E 1 I I I I 1 I 1 I I 1 I I I I > ■ ■ ■ I > ■ ■ 1 1 1 1 < 1 1 1 1 Annn 
TGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCA 4777 

ACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCG 4622 

| | | 1 | I I I 1 I 1 I I I 1 I I I I 1 I I 1 I I I ■ I I 1 1 I t I ■ 1 I 1 > 1 ■ ■ I >>■ ■ > 1 1 1 1 1 1 1 AO „ 

ACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCG 4837 



TGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCA 4682 

I I I I || | M I I I II I I I I I II I I M I I I I I I I I I I I I I I I I I I M I II I I M 

4838 TGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCA 



4683 
4898 
4743 
4958 
4803 
5018 



ACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTC 

Ml | || | | | | I I I I I I M I M II II I I I M I I I I I II I I I II I M I I II I I M I I II I II 
ACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTC 

GGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCG 

| | | | II I I I I I I I I I I I I I INI I I I I I II I I M I II I I I I I I II I I I I I I I I I Ml I I I 
GGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCG 



4897 
4742 
4957 
4802 
5017 
4862 



TGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGC 

| | | || I I I I I II I I I I II I II N I N UN I N N I I N I N I I I 

TGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGC 5077 



4863 AGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCT 4 922 

| | | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I M I I i I I M I M I I I I I I I M I I I I I 
507 8 AGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCT 5137 

4 923 CCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCT 4 9 82 

| | | | | | | | | I II II I I I I I I I I I I I I I I M I I I I I I I I M I I I I I t I 

5138 CCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCT 5197 

4983 TCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACA 5042 

|| | | | | M I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I 

5198 TCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACA 5257 

5043 T CCT GAC CGAC AT C AC C GGC CAC AAT GT CT CT GAGT AC CT GCT CT T C AC CT C C GACC GCT 5102 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M M I I I M I I II II I I I I I I I I I 

5258 TCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCT 5317 

5103 TCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCT 5162 

| | I I I I I II II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

5318 TCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCT 5377 

5163 CATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGG 5222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I 

5378 CATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGG 5437 

5223 TTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACG 52 82 

| | | M I I I II M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M M 

5438 TTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACG 54 97 

5283 CCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCG 5342 

I | | | | | || | | | I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I M I I I I I I I II 

5498 CCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCG 5557 

5343 TCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGG 5402 

|| | | | | | | | | | | | I I I I II I I I I I I I I I I I I I I I I I I M I M II I I I I I I I I I I M I I I I 
5558 T CAC CAACC AC C C CAT GAAT AAGAC C AG C G C C AG CCTCTCCCTG GAT T AC CT GCT G C AG G 5617 

5403 GCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCT 5462 

I I I M I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I 

5618 GCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCT 5677 

54 63 TCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCG 5522 

| | | | | | M I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

5678 TCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCG 57 37 
5523 GCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGG 5582 

| | | I I II I I I I I I M I I I I I I I I M II I I I I I I I I I I I I I I I I I I I M I I II I II I I I I I 

5738 GCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGG 57 97 
5583 TCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGC 5642 

| | | | | | I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I II I I I I I M I I I I I I I 

5798 TCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGC 5857 

5643 CCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCA 57 02 

|| | | | | | | | | II I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I M I I I I I I I I I I M 
5858 CCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCA 5917 



5703 TCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTG 5762 

| | | M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I 

5918 TCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTG 5977 
57 63 TCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCG 5822 

I I I I I I I II I I I I I I I I I I I I I I I I MM I M I I M I II 

597 8 TCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCG 6037 
5823 AG C AC GAC AAGGAC CT GAAGGT T GT C AAC AGT T AC CT GAAAAG CTGCTTCCT CAT T T T C C 5882 

M I I I I I II I M I M I II I I I I I I I I I I I M I I I I I M I I I I II I II 

6038 AG C AC G AC AAG GAC C T GAAGGT T GT C AAC AGT T AC C T GAAAAG CT G CT T C C T CAT T T T C C 6097 
5883 CCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGAGT 5942 

I I I I I II I I II M M II I M I I I I II M II II I I M I II II I II M I I I I II I I I I I I I I 

6098 CCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGAGT 6157 

5943 AC T AC G C C AAG AT T G G C C AGT T T GAC AAG AT GAAG TCCCCGTTC G AGT G G GAC AT T GT C A 6002 

| | M | | || | | I I II I I I I I I I II II I I I I I I I M I I I I I I II I I I I I I I M I I I I M I I I 
6158 AC T AC G C C AAG AT T G G C C AGT T T G AC AAGAT G AAGT CCCCGTTC G AGT G G GAC AT T G T C A 6217 

6003 CCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGT 6062 

| I I I I I I I I II II I I I I I M I M MM Mill 

6218 CCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGT 627 7 

60 63 GCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACC7VAGCCTGTGGAGG 6122 

| M | | | || || I I I II I II II II M I I I I I I I I M I II M II II M II I II I I M M I I M 
627 8 GCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGG 6337 

6123 AT GAT GT GGACGTGGCCAGT GAGCGGCAGC GAGTGCT CCGGGGAGAC GC CGACAAT GACA 6182 

| I I I I I I II II II I I II I M II I I II I II I I II M I I II I II I I II I II 

6338 AT GAT GT GGACGTGGC CAGT GAGC GGCAGCGAGT GCT C CGGGGAGACGC C GACAAT GACA 6397 

6183 T G GT C AAGAT T GAG AAC CT GAC C AAG GT CT ACAAGT C C C G GAAGAT T G G C C GT AT C CT G G 6242 

| | | || II I I I I M M I I I I I M I II II I I I I I M M II I II I M II II II I II I II I I II 
6398 T G GT C AAG AT T G AGAAC C T GAC C AAG GT C T AC AAGT C C C G GAAGAT T G G C C GT AT C C T G G 6457 

6243 CCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCA 6302 

| | | | I M | I I I M II I II I I II M I I I I II I I Mill 

6458 CCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCA 6517 

6303 ACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGG 6362 

| | | | | || || I I I II II I II I I M M M M I M M I M M II II II M II I I II I M I II I 
6518 AC GGT GC G GG CAAGAC C AGC AC CT T CAAGAT G CT GAC C GG C GAC GAGAG C AC GAC G G GG G 6577 

63 63 GCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCC 6422 

| || || || || I || || I M II I II I M M I I II I II II II II I II I II M M I II I II I I M 
657 8 GC GAGG C CT T C GT CAAT G GACAC AG C GT GC T GAAG GAGC T GCT C C AG GT G CAGC AGAG C C 6637 

6423 TCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGC 64 82 

IN II II II I II II M I I II II II I II M M M I I M I M II M M I M 

6638 TCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGC 6697 

64 83 AGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGG 6542 

I I I II I II II II I II II M M M II I I II M II II II I I I II I I M II 

6698 AGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGG 6757 

6543 CTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCG 6602 



6758 CTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCG 6817 

6603 GCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCC 6662 

M II I I I I I I I I I I I I I I I I I I > I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 
6818 GCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCC 6877 

6663 TGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCC 6722 

I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

6878 TGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCC 6937 

6723 TCGACCTCATCAAGACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCG 67 82 

| | | | | | I | | I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I II I I 

6938 TCGACCTCATCAAGACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCG 6997 

6783 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 6842 

| I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

6998 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 7 057 

6843 TCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTGCGGACCAAGAGCA 6902 

| | I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I 
7058 TCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCACGGTGCGGACCAAGAGCA 7117 

6903 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 6962 

| | | | | | I I I I I I I I I I I I I I I I I M M I I I I I I I M I 

7118 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 7 177 

6963 AGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCC 7 022 

|| I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 

7178 AGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCC 7237 

7023 AGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCA 7082 

| | M I I I I I I II I I I I IN I 

7238 AGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCA 7297 

7083 GCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCTGG 7142 

| | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I M 
7298 GCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCT GG 7357 

7143 AGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCC 7202 

M I I I Ill I I I I I I I I IMM I I I I I I I I I I I I I I M 

7358 AGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCC 7417 

7203 TGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGG 7262 

| | M Ill Mil I I I I M II I I II I M I IMM 

7418 TGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGG 7 477 

7263 ACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCT 7322 

| | | || || || || I II II II I I II II M II I II I II M I M II II I I II I M M M I 

7478 ACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCT 7537 

7323 TCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTG 7382 

| | | | || | || || I II II II I I II II I I II I I I I II I I II II II II II II I I I M M II II I 
7538 TCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTG 7597 



7383 ACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCA 7 442 
|| | | | | | | | | | I II II II II II II II II II I I II I M I M II I II II II I II II I I M I I 



Db 7598 ACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCA 7657 

Qy 7443 GGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGC 7502 

M | | | I I I I I I II I I I I I I I I I > I M I I I I I M I I M I I I I I I I I I I I I I I I M I I I I I I 
Db 7 658 GGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGC 7717 

Qy 7503 CATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGG 7562 

| | I I I I I I I II I I I I I I II I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 1 I I 
D b 7718 CATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGG 7777 

Qy 7563 GCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCC 7622 

I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

D b 77 7 8 GCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCC 7837 

Qy 7623 CCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTT 7682 

I | I I I I I I I II II I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I M M I I I I 

Db 7838 CCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTT 7897 

Qy 7683 TCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGC 7742 

| | | | M M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I I M I I I II I II I I I I 
Db 7898 TCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGC 7957 

Qy 7743 GGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCT 7802 

| | | | | I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 
Db 795 8 GGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCT 8 017 

Qy 7803 GGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCT 78 62 

| | | | | | | | II I I I I I II I I II I I I I I I I I I I I I M M I I I I I I I I I I I 1 I I I I I I I I I I I 

Db 8018 GGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCT 8 077 

Qy 7 8 63 GG CAGGT GG CAGGAAT GGAGAAG CT GAC CCTGCTGGC CAGGCAAG GG GCC AGAC C C C C C C 7 922 

| | | | | | | | | II I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I M I I I I I I I 

Db 8078 G G C AG GT GG CAGGAAT GGAGAAGCT GAC CCTGCTGGC CAG GCAAG GG G C CAG AC C CC C C C 8137 

Qy 7923 CAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTG 7982 

| || II I I I I I I I I M I I I I I II I I II II I I I II I I I I I I I I I M I I M I I I I I I I I I I I I 
Db 8138 CAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTG 8197 

Qy 7983 G GAG CCGGGCCT GT AC AT AGC GC AC AGAT GT TT GT T TT AAAT AAAT AAACAAAAT GT C 804 0 

| | II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 8198 GGAGCCGGGCCTGTACAT AGC GCACAGATGTTTGTTTTAAAT AAAT AAACAAAAT GTC 8255 



RESULT 4 
AAH75187 

ID AAH75187 standard; cDNA; 8195 BP. 
XX 

AC AAH75187; 
XX 

DT 13-NOV-2001 (first entry) 
XX 

DE Nucleotide sequence of a human 17114 transporter polypeptide. 
XX 

KW Human; transporter; 20685; 579; 17114; 23821; 33894; 32613; 

KW vesicular monoamine transporter; neurotransmitter-symporter ; 

KW ABC transporter; sulfate transporter; neurological disorder; 

KW central nervous system disorder; Parkinson f s disease; depression; pain; 



KW infectious disease; cell proliferative disorder; cancer; blood disorder; 

KW immune disorder; inflammatory disorder; spleen disorder; lung disorder; 

KW Hodgkin f s disease; Niemann-Pick disease; chronic bronchitis; ischemia; 

KW colon disorder; cirrhosis; uterus disorder; endometrium disorder; 

KW endometrial stromal tumour; brain disorder; T-cell disorder; anemia; 

KW Sjogren syndrome; skin disorder; lupus erythematosus; heart disorder; 

KW haematopoietic stem cell; Alzheimer's disease; myocardial infarction; 

KW blood vessel; Kawasaki syndrome; red cell disorder; thymus disorder; 

KW B-cell disorder; kidney disorder; glomerulonephritis; breast disorder; 

KW testis disorder; thyroid disorder; Graves disease; pancreatitis; 

KW skeletal muscle disorder; tumour; pancreas disorder; 

KW small intestine disorder; celiac sprue; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 132. .7442 

FT /*tag= a 

FT /product= "transporter" 

XX 

PN WO200164875-A2. 
XX 

PD 07-SEP-2001. 
XX 

PF 28-FEB-2001; 2001WO-US006374 . 
XX 

PR 29-FEB-2000; 2000US-0185906P . 
XX 

PA (MILL-) MILLENNIUM PHARM INC. 
XX 

PI Glucksmann MA; 
XX 

DR WPI; 2001-550178/61. 

DR P-PSDB; AAG67160. 
XX 

PT Novel human transporter polypeptides useful for treating and diagnosing 

PT Parkinson's disease, Hodgkin disease, glomerulonephritis, myocardial 

PT infarction, Grave's disease, Alzheimer's disease, anemia, asthma and 

PT tumors . 
XX 

PS Claim 2; Fig 14A-G; 259pp; English. 
XX 

CC The present sequence encodes a human transporter polypeptide. The 

CC specification describes 20685, 579, 17114, 23821, 33894 or 32613 human 

CC transporter polypeptides. The 20685 transporter is similar to vesicular 

CC monoamine transporters. The 579 transporter is similar to 

CC neurotransmitter-symporters . The 17114 transporter is similar to ABC 

CC transporters. The 32613 transporter is similar to sulfate transporters. 

CC The transporter polypeptides and polynucleotides are useful for treating 

CC and diagnosing neurological and central nervous system disorders (e.g. 

CC Parkinson's disease, depression, pain), infectious disease, cell 

CC proliferative disorders (e.g., cancer), blood disorders, and immune and 

CC inflammatory disorders. They are also useful for treating and diagnosing 

CC disorders involving the spleen (e.g., Hodgkin disease, Niemann-Pick 

CC disease), lung (e.g., chronic bronchitis ) , colon (cirrhosis), uterus and 

CC endometrium (e.g., endometrial stromal tumours), brain (e.g., ischemia), 

CC T-cells (e.g., Sjogren syndrome), skin (lupus erythematosus), 



haematopoietic stem cells (e.g, Alzheimer's disease), heart (e.g., 
myocardial infarction), blood vessels (e.g., Kawasaki syndrome), red 
cells (e.g., anemias), disorders involving thymus, B-cells, kidney (e.g., 
glomerulonephritis), disorders involving breast, testis, epididymis, 
prostate, thyroid (e.g., Graves disease), disorders involving skeletal 
muscle (e.g, tumour), pancreas (e.g., pancreatitis), small intestine 
(e.g., celiac sprue), disorders related to reduced platelet number and 
ovary 

Sequence 8195 BP; 1522 A; 2723 C; 2455 G; 1494 T; 0 U; 1 Other; 

Query Match 99.9%; Score 8032; DB 4; Length 8195; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 8035; Conservative 0; Mismatches 5; Indels 0; Gaps 0; 

1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I 1 I I I I I I I t I I I I 1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

98 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 157 

61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

| | | | | I I I I I I I I I I I I II I I I I I I I II I II II I I I I I I II I I I I I I I I I I I I I I 

158 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 217 

121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

II I I I I I I I I i I I I I I I I I I I I I I I I I I II I I I M I I I II I I I I I I I I I I I I I I I 

218 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 277 

181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

| | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

278 CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 337 

241 TGTCATGCJQATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I I I I I II I I I I I I I I I I I I M I I I M I I I I I I I M I I I I I I I I I II 

338 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 397 

301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

| | | | | | || | | | | | | I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
398 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 457 

361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I M I I I 

458 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 517 

421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 

518 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 577 

481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 

I I I I M | I I I I I I I I I I I M I I I I I M I I I I I I I I I I II I I I M I I I I I I M I I I I I I I I 

57 8 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 637 

541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

M I I II I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 
638 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 697 



601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I I M II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I M I I II I I I I I I I I 



698 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 7 57 

661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I | | M | | | I | | | I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

758 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 817 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I 

818 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 877 

7 81 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

I I I I I I 1 I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 1 M I I I! I I I I II I I I I I I I I II 
878 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 937 

8 41 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I M M M M I I INN I I I I I I M 

938 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 997 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I 

998 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1057 

961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 102 0 

I I I I I I I I I I I I II I I II I I I M I I I M I I I I 

1058 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1117 

1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

I I I I I I I I I I II I I I I I I II I I I I I I II I I I I I I II I I I I I I I I I I I I I II II I II I I I I 
1118 TGCCCAG7VAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1177 

10 81 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

| | M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
117 8 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1237 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

| | | M | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I II I I I I I I I I I II I 
1238 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1297 

1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

| | | | M | | | | M I I I I I I I I I I M I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
12 98 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1357 

1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I 1 I I I I I I I I I I I I I M I II I I I I I I 

1358 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1417 
1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

| | | | | | I I I I I I I I I I I I I I I I I I 1 I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I M M I I 

1418 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGC^AGGAGCAGCGGAACCTGGGCCT 14 77 

1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

| | | I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I 
1478 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1537 

14 41 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I ! I I I I I I M I i I I I I I II I I I I I I I I I 1 

1538 CGACCGCGTCATCCTCAAGGCC7VACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1597 



Qy 


1501 


TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 

i i i i i i i i i i i i i i i i i i i i i i i l i i i i i i i i i i I I i I I I I I I t I 1 I i I I 

| | | | | | | | | | I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 II 1 1 1 M 1 1 1 1 M 1 1 1 1 l I 1 II 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 


1560 


Db 


1598 


1657 


Qy 


1561 


GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 

i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i I I i i I i I l 1 i i i I 

M | | | | I I I II 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 II M 1 1 M 1 II II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 


1620 


Db 


1658 


1717 


Qy 


1621 


ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 

i i i i i i \ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I I i i i i 
| | | | | | || I | 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 

ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 


1680 


Db 


1718 


1777 


Qy 


1681 


CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 

i < i i i i i i i i i i i i i i i i i i i i l l l l 1 l 1 1 1 1 1 E 1 1 1 1 1 1 ! 1 1 I 1 1 1 1 1 1 

| | | | | | | | I I M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 


1740 


Db 


1778 


1837 


Qy 


1741 


C C AG T T CAT G T C C AAG G T GAG C GT G G AC AT C T T C AAG GGCTTCCCC GAC GAG GAG AG CAT 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i t i i i 

I M 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CC AGT T CAT GT C CAAGGT GAG C GT G GAC AT C T T CAAGGG C T T C C C C GACGAGGAG AGC AT 


1800 


Db 


1838 


1897 


Qy 


1801 


TGTCAACTACACC CT CAACCAGGCCT ACCAGGACAAC GT CACTGTT TT T GCCAGT GT GAT 

,.,,,1111 i i ] i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i 

M 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

T GT C AACT AC AC C CT CAAC CAGG C CT AC CAG GACAAC GT CACT GT T T T T GC C AGT GT GAT 


1860 


Db 


1898 


1957 


Qy 


1861 


CT T C C AG AC C C GGAAGGAC GGCTCGCTCCCGCCT CAC GT GC ACT ACAAGAT C CGC CAGAA 
, , , , i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I I M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 

CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 


1920 


Db 


1958 


2017 


Qy 


1921 


CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I M I II 1 1 1 1 1 M 1 II 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTCCAGCTTCACCGAGAAAAC CAAC GAGATCCGCCGCGCCT ACT GGCGGCCTGGGCCCAA 


1980 


Db 


2018 


2077 


Qy 

Db 


1981 
2078 


TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 

i i i i i > i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i 

| | II 1 II 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 


2040 
2137 


Qy 

Db 


2041 
2138 


CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 
. i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i t i i i i i i i i i i i 

M 1 II 1 M 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 


2100 
2197 


Qy 


2101 


GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 

, , i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 


2160 


Db 


2198 


2257 


Qy 


2161 


GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 

• ■■I i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i t i i i i 

II 1 II 1 II II II II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 M 1 1 1 1 1 1 1 

GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 


2220 


Db 


2258 


2317 


Qy 


2221 


G GAG AAG GAG CAC C G G C T C AAG GAG GT GAT G AAG AC CAT G G G C C T G AAC AA C G C G GT G C A 

II 1 1 1 1 1 II II II 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 

GGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCA 


2280 


Db 


2318 


2377 


Qy 


2281 


CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 

II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 II 1 1 1 II 1 1 1 M 1 1 M 1 1 1 1 M 1 1 1 II 
CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 


2340 


Db 


2378 


2437 



2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

| | | | I I I II I I I I I I I I I I I I I II I I II I I I I II M I I 

2438 CGCCATCCTGAAGTACGGCCAGGTGCTTATACACAGCCACGTGGTCATCATCTGGCTCTT 24 97 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

I Mill III II MM I IN I M IN I II I Mil Mill Mill III M 

2498 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2557 

2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

M I I I I I M I II I I I M I I II I I I M M I I M M I I M I I I I II M I I I M I I I I I I I I I 
2558 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2617 

2521 CATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTG 2580 

M M II II I II II I II I I I I I I I I II I I I I I M I I M I I I I I I II I I II I I I I I I 

2618 CATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTG 2677 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2640 

Ml M M I I I I I M I II II I I M I I M I I II I M I I I I II I I I I 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2737 



2678 
2641 

2738 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2797 



TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

i ii 1 1 1 1 1 1 1 1 1 1 M i 1 1 ii ii i ii 1 1 1 1 1 1 1 1 M 1 1 M i mill mm III' 



2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 

M || I I I II I II II I I I II I I I I I II I I I II I I I I I I I M I I I M I I I I 

2798 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 

M II I I I I I I M I I II II I I I I I M I I I M M M M I I II II I I M I M M M I 

2858 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 

M I II I II II I I I I II I M I I M M I M I I II I I I II I II II I I I I I I I M I I I I II I M 
2918 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 

2881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 

M | M I I I I I M M M I M M II II I II I M II II M I I II II I 

2978 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 



2941 
3038 
3001 
3098 
3061 
3158 
3121 
3218 



GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 

M I I II I II I I II I I I I M II I I I I I M M I M I I M I I I I I I I II M I I I I I Ml I I II 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 
GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 

M I II I I I I I I M I I M I I I I II I I I I I I II I I I I M II II I I I I II 

GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 



CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 

M M I I I II II I I I M M I II M I M I M M I II II I I I II I I I II I M 

CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 
GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 

M I II I M II I I II I I I I I II I I I I M M I I II II II I II II I I I M 

GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 



2760 

2857 

2820 

2917 

2880 

2977 

2940 

3037 

3000 

3097 

3060 

3157 

3120 

3217 

3180 

3277 



3181 CACCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTGGGCAT 3240 



327 8 C AC CAT CT AC GG G CAC GAC AT C C G CACGGAGAT G GAT GAGAT C C G CAAGAACCT GGG C AT 3337 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

| | | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M II II I II I I I I 
3338 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3397 

3301 CT C AC G GCT C AAG AG CAT G G CT C AG GAG GAGAT C C G C AG AGAGAT GGAC AAG AT GAT C GA 3360 

I I I I II II I I I I I I I I I II I II I I II I I I I I I I I I I I I I I I M I I I I I 

3398 C T CAC GG CT CAAGAGCAT GGC T C AG GAG GAGAT C C GCAGAGAGAT GGACAAGAT GAT C GA 3457 

3361 GGACCT G GAGCT CT C C AACAAAC G GC ACT CAC T GGT GC AGACATT GT CGGGT G GC AT GAA 342 0 

| M II I II I I I I I I I I I I I I I I I I II I I I I II I I II I I I I I I I I I II I I I I I I I I I I I I I 
34 58 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3517 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 348 0 

I I I I II I I II II I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I II 

3518 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3577 

3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 354 0 

I | | | | | | | | I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 
357 8 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3637 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

| M I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I M I 

3638 CAAGC CAGGC C GC AC CAT C CT T CT GT CC AC CC AC C ACAT GGAT GAG GCT GACCT GCT T G G 3697 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I II II I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

3698 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3757 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3758 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3817 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I I I I I I I I I I I I I I I I I I II MINI I I I I I I I I I I I I I I I 

3818 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3877 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

M I i I I I I I I 1 I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I 1 I I I I I 
387 8 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3937 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

3938 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3997 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

| | || | | | | | I I II I I I I I I I I I I I I I I II I I I II I I I I I M I I I I I I I M I I I M I I I I I 
3998 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4 057 

3 961 GCT GAT G GAC AC GAC C CT G GAG GAAGT GT T C CT C AAGGT GT C GGAG GAG GAT C AGT C G CT 4020 

| | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I II I I I I I I 

4 058 GCT GAT G GAC AC GAC C C T G GAG GAAGT GT T C CT CAAGGT GT C GG AG GAG GAT CAGT C GC T 4117 



4 021 GGAGAACAGT GAGGCCGAT GTGAAGGAGT CCAGGAAGGATGT GCTCCCT GGGGCGGAGGG 4 080 

I | I I I || I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I M I II 



Db 


4118 


Qy 


4081 


Db 


4178 


Qy 


4141 


Db 


4238 


Qy 


4201 


Db 


4298 


Qy 


4261 


Db 


4358 


Qy 


4321 


Db 


4418 


Qy 


4381 


Db 


4478 


Qy 


4441 


Db 


4538 


Qy 


4501 


Db 


4598 


Qy 


4561 


Db 


4658 


Qy 


4621 


Db 


4718 


Qy 


4681 


Db 


4778 


Qy 


4741 


Db 


4838 


Qy 


4801 


Db 


4898 


Qy 


4861 


Db 


4958 



G GAGAAC AGT GAG GC C GAT GT GAAGGAGT C C AGGAAGGAT GTGCTCCCTGGG GCGGAGGG 4177 



CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 

| | | | | | | M I I I I I I I I I M I II I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 



4140 



4237 



4200 



GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II M 
GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 97 

CT AC AC C GAC GT CT AT G G C GACT AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AGAC AA 42 60 

| | I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II II I I I I I I I I 

C T AC AC C GAC GT CT AT GGC GAC T ACC GCC CC CT CT T T GAT AAC C CAC AG GAC C CAGACAA 4357 

TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I || I I || I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4417 

GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 43 80 

I | | | | | | I I I I I I I I I I I I II I I I I I I II I I I II I I I I I I I I I I II I I I I I I I I I I I I I I 
GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4477 

CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4440 

I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4537 

CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I I 
CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 45 97 

C C T GT CAC C T T C C C AGT AC CAC AAC T AC AC C C AG CCCCGTGG C AAT T T CAT C C C C T AC G C 4560 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

C CT GT CAC CT T C C C AGT AC CAC AAC T AC AC C C AG C C C C GT GGC AAT T T CAT C C C CT AC GC 4657 

CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 620 

I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4717 

CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 680 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M 

CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 777 
CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 47 40 

I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 837 

TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 00 

II I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I I I 

TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 97 

CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 8 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 957 

GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 920 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I 

GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 5017 



4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4980 

I I I II I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5018 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 5077 

4 9 81 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

M I I I I I I I I I I I II I I I I II 1 I I I I I II I I I I I I I I I I I I I I 

5078 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5137 

5041 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5100 

| | | | || | | | | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I t I I I I I I I I I I 

5138 CAT C C T GAC C GAC AT C AC C G GC C ACAAT GT C T CT GAGT AC CTGCTCTT C AC CT C C GAC C G 5197 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I | | | | | || | | | I I I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I I I I I I I I I I I M I 

5198 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5257 
5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

5258 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5317 
5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 528 0 

| | | | | | | I I I I I ] I I I I I I I 1 1 I It I 1 I I I I I I II I I M II I I I I I I I I 1 I I M I I I I I I 

5318 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5377 

5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5378 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5437 

5341 C GT C AC C AAC C AC C C CAT GAAT AAGAC C AGC GC C AGC CTCTCCCTG GAT T AC CT G CT G C A 540 0 

| | | | | | I I I | | | I ! I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I t I I I I 

5438 C GT C AC C AAC C AC C C CAT GAAT AAGAC C AGC G C C AGC CTCTCCCT GGAT T AC CT G CT G C A 5497 

5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 54 60 

| | | | | | | | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I Ml 

5498 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5557 

5461 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I I I II I I I I I I I I I I I I I M I I I I I I I M I I I I II I I I I II II I I I I I I I I I I I II I I II 

5558 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5617 
5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 558 0 

| | | | | | | | II I I I I I I I I II I I I I I I I I I I I I II I II I I I I I M I I I I II I I I I I 

5618 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5677 

5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 564 0 

|| || | | | || | || I I I I I I I I I I I I I I I I I II I I I II i II II I I I I I I I I I 1 I I I I I I I I I 
567 8 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5737 

5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

| | | | | | | | | | I I I I I I II I I I I I I II I I I I II I I I I I M I M I I I I I I I M t I I I I I I I I 

5738 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5797 
5701 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I i I I I M I I I I I I I I I I I I I 

5798 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5857 



57 61 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5 82 0 

I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I 

5858 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5917 

5 821 C GAG C AC G AC AAG GAC C T GAAG GT T GT C AAC AGT T AC C T G AAAAG CTGCTTCCT CAT T T T 58 80 

I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I M I I II I II I I 

5918 C GAG C AC GACAAGGAC CT GAAG GT T GT CAAC AGT T ACCT GAAAAG CTGCTTCCT C AT TT T 597 7 

5881 C C C CAAC T AC AAC C T G G G C C AC G G GC T CAT G GAG AT G G C C T AC AAC G AGT AC AT CAAC G A 5940 

I I I M I I I I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I M I 

5978 C C C CAACT AC AACCT G GGC CAC GGGC T CAT G GAGAT GGC CT ACAAC GAGT ACAT CAACGA 6037 
5941 GT ACT AC G C C AAGAT T G G C C AGT T T GAC AAGAT GAAGT C C C C GT T C GAGT G GGAC AT T GT 600 0 

I I M I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I M I I I I I I I I I I I M I I II 

6038 GT ACT AC G C CAAGAT T GGC C AGT T T GACAAGAT GAAGT C C C C GT T C GAGT GG GAC AT T GT 6097 

6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
6098 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6157 

6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

| | I I I M I I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
6158 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6217 

6121 GGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGA 6180 

M I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

6218 GGAT GAT GT GGAC GT GGCC AGT GAGCGGCAGCGAGT GCT C C GGGGAGACGCCGACAATGA 6277 

6181 CAT GGT CAAGAT T GAGAAC CT GACCAAGGT CT ACAAGT CC C GGAAGAT T GGC C GT AT C CT 624 0 

| | II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
6278 CAT GGT CAAGAT T GAGAAC CT GAC CAAGGT CTACAAGT C C C GGAAGAT T G GC CGT AT C CT 6337 

6241 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II II I I I I I I 

6338 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6397 

6301 CAAC G GT G C GG G CAAGAC C AG CAC CT T CAAGAT GCT GAC C GGC GAC GAGAG CAC GAC GGG 6360 

| | | | | | | | || | | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6398 CAAC G GT GC GGG CAAGAC C AGC AC CT T CAAGAT GCT GACC GGC GAC GAGAG CAC GAC GGG 64 57 

63 61 GGGC GAGGC C T T C GT C AAT GGAC AC AGC GT G CT GAAG GAG CT G CT C C AG GT GC AG C AGAG 6420 

I | | | I M I I I I II I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I M I I I 

6458 GGGC GAGGCCTT CGT CAATGGACACAGCGT GCT GAAGGAGCT GCT CCAGGTGCAGCAGAG 6517 

6421 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 648 0 

|| | M | | | | | | | || | | I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I 
6518 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6577 

6481 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6540 

I I II I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 1 I I I I 

6578 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGT GGT GAAGT G 6637 

6541 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

6638 G G C T C T G GAG AAG C T G GAG C T GAC C AAG T AC G C AG AC AAG CCGGCTGG CAC C T AC AG C G G 6697 

6601 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 



Db 


6698 


Qy 


6661 


Db 


6758 


Qy 


6721 


Db 


6818 


Qy 


6781 


Db 


6878 


Qy 


6841 


Db 


6938 


Qy 


6901 


Db 


6998 


Qy 


6961 


Db 


7058 


Qy 


7021 


Db 


7118 


Qy 


7081 


Db 


7178 


Qy 


7141 


Db 


7238 


Qy 


7201 


Db 


7298 


Qy 


7261 


Db 


7358 


Qy 


7321 


Db 


7418 


Qy 


7381 


Db 


7478 


Qy 


7441 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 67 57 

CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 672 0 

I M I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I M 

CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6817 

CCT CGACCTCATCAAGACAGGGCGTT CAGTGGTGCT GACAT CACACAGCAT GGAGGAGTG 67 8 0 

II II I I I I I I II I I II I I I I I I I I I I I I I I II I I 

C CT CGAC C T CAT CAAGAC AGG GC GTT CAGT G GT GCT GACAT CACAC AG CAT G GAG GAGT G 6877 

CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6840 

I | | | | | | | I I | I I I I I I I I I I I I II I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I 

CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6937 

CAT C CAGCACCT GAAGAACC GGTTT GGAGAT GGCTACAT GAT CAC GGT GCGGAC CAAGAG 6900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

C AT CC AG CAC C T GAAGAAC C G GT T T G GAGAT G G CT ACAT GAT CAC GGT GC GGAC CAAGAG 6997 



I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7020 
| | | | I I I I I 1 I i M I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

CAAGGAGCGGCACCACACAAAGGT GCAGTAC CAGCT CAAGT C GGAGCACATCT CGCT GGC 7117 

CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 708 0 

I || I I I I || I I I I I I I I I I II I I I II I II I I I I I I I I I I II II M I I I I I I I I 

C C AGGT GT T CAG CAAGAT G GAGC AGGT GTCTGGCGTGCTGGG CAT C GAG GACT AC T C G GT 7177 

CAGC CAGAC CAC ACT G GACAAT GT GT T C GT GAAC T T T GCCAAGAAGC AGAGT GACAAC CT 714 0 

I || I I II I I I I II I I II I I M I I I II I I I I I I I I I I I I I I M I I I I II II I I M I 

CAGC CAGAC CAC ACT GGACAATGT GTTC GTGAACTTT GC CAAGAAGCAGAGT GACAACCT 7237 



GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 

I | | | | I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I M I I I 

GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 



7200 



7297 



CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I I I I I I I I II M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7357 
G G AC CT GGAC AC G GAG GAC GAGG G C C T CAT C AGCT T C GAG G AGGAG C GG GC C CAG CT GT C 7320 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II II I I 

GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7417 
CT T CAAC AC GGAC AC GCTCTGCT GAC CAC C C AGAGCT GG G C CAG G GAG G AC AC GC T C CAC 7380 

I I I I I I M I I M I I I I I I I I I I I II I I II I I I I I I i I II I I I I I M I I I I I I I I I I I I I I 

C T T CAAC AC G GAC AC GCTCTGCT GAC CAC C CAG AG C T G G G C CAG G GAG GAC AC G C T C CAC 7 477 

T GAC CAC C CAG AG C T G G G C CAG G GAC T C AAC AAT G G G GAC AG AAGT C C C C CAGT G C C T G C 744 0 

| | I I || I I I I I I I I I I I I I I II I I I I II I I I II I I I I II I I I I I I I I I I M I I I I I I I I I 
TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7 537 

CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 
I I I I I I I I I I I I I I I I I I I I i I I I I I I I II M I I I I I I I I i I I I M I I I I I I I I I I I I I I 
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Qy 
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7658 


Qy 
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Db 


7718 


Qy 
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Db 


7778 


Qy 


7741 


Db 


7838 


Qy 


7801 


Db 


7898 


Qy 


7861 


Db 


7958 


Qy 


7921 


Db 


8018 


Qy 


7981 


Db 


8078 



CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7597 

GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

M I I I I I I I I I I I I I I > I I I I I M I I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I 
GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7657 

GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7620 

I I M I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7717 

CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 768 0 

I I I I I I I I I I I I I I II I I I II I I I I M I I I II I I I I II I I I I I I 

CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7777 

TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 77 4 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7 837 

GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7897 

CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7 8 60 

| | 1 I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I i 1 I I I I I I I I I I I I I I I M I I I I I I I M 
CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7957 

CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7920 

| I | I | I I I I I I I I I 1 I I I I I ! I I 1 I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I t I 
CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 8017 

CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7 980 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCCCCTCCC 8077 



T GG GAG CCGGGCCT GT AC AT AG C GCAC AGAT GTT T GT T T T AAAT AAAT AAACAAAAT GT C 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I I I I I I I 
T G G GAGC C GG G C CT GT AC AT AGG G CAC AGAT GTTTGTTTT TAAT AAAT AAACAAAAT GT C 



8040 



8137 



RESULT 5 
ABX70982 

ID ABX70982 standard; cDNA; 8037 BP. 
XX 

AC ABX70982; 
XX 

DT 05-MAR-2003 (first entry) 
XX 

DE Novel human cDNA sequence #207. 
XX 

KW Human; gene; ss; nervous system disorder; peripheral neuropathy; 

KW Huntington's disease; amyotrophic lateral sclerosis; haemophilia; 

KW neurodegenerative disease; Parkinson 1 s disease; Alzheimer's disease; 

KW autoimmune disease; systemic lupus erythematosus; rheumatoid arthritis; 

KW insulin-dependent diabetes mellitus; anaemia; thrombocytopaenia ; wound; 

KW ulcer; burn; bone disorder; osteoporosis; osteoarthritis; stroke; 

KW fibrosis; reperfusion injury; infection; allergic rhinitis; asthma; 

KW coagulation disorder; cancer; tumour; inflammatory disease; septic shock; 



KW Crohn's disease; anaphylaxis; proliferation; chemotactic; 

KW differentiation; stem cell growth factor; haematopoiesis ; chemokinetic; 

KW haemostatic; antiinflammatory; expressed sequence tag; EST. 

XX 

OS Homo sapiens. 
XX 

PN WO200281731-A2. 
XX 

PD 17-OCT-2002. 
XX 

PF 29-JAN-2002; 2002WO-US001222 . 
XX 

PR 30-JAN-2001; 2001US-00774528 . 
XX 

PA (HYSE-) HYSEQ INC. 

PA (GOOD/) GOODRICH R W. 
XX 

PI Tang TY, Liu C, Zhou P, Asundi V, Zhang J, Zhao QA, Ren F; 

PI Xue AJ, Yang Y, Wehrman T, Wang J, Wang D, Drmanac RT; 

XX 

DR WPI; 2003-058563/05. 
XX 

PT Novel polypeptide useful for treating neurodegenerative diseases, myeloid 

PT or lymphoid cell disorders , bone disorders, mechanical and traumatic 

PT disorders, coagulation disorders, and inflammatory diseases. 
XX 

PS Claim 1; Page; 612pp; English. 
XX 

CC This invention relates to the cDNA sequences encoding an isolated novel 

CC human polypeptide. The protein encoded by the nucleic acid of the 

CC invention is useful for treating central and peripheral nervous system 

CC diseases (e.g. peripheral neuropathy, Huntington's disease, amyotrophic 

CC lateral sclerosis); neurodegenerative diseases (e.g. Parkinson's disease, 

CC Alzheimer's disease); autoimmune disease (e.g. systemic lupus 

CC erythematosus, rheumatoid arthritis, insulin-dependent diabetes mellitus) 

CC ; myeloid or lymphoid cell disorders (e.g. anaemia and thrombocytopaenia) 

CC ; wounds, ulcers, burns; bone disorders (e.g. osteoporosis, 

CC osteoarthritis); mechanical and traumatic disorders (e.g. stroke, head 

CC trauma); lung or liver fibrosis; reperfusion injury in various tissues; 

CC bacterial, viral or fungal infections; allergic conditions such as 

CC allergic rhinitis, asthma; coagulation disorders (e.g. haemophilia); 

CC cancer and tumours; and inflammatory diseases (e.g. septic shock, Crohn's 

CC disease, anaphylaxis) . The protein may be used to inhibit the growth, 

CC infection or function of infectious agents such as bacteria, fungi, 

CC viruses, or to effect bodily characteristics, biorhythms or circadian 

CC cycles of rhythms. The protein may also have 

CC proliferation/differentiation, stem cell growth factor, haematopoiesis 

CC regulation, immune stimulating or suppressing, chemotactic/chemokinetic, 

CC haemostatic and thrombolytic, receptor/ligand, and antiinflammatory 

CC activities. The cDNA sequences of the invention are useful for expressing 

CC recombinant protein for analysis. The present sequence represents a novel 

CC human cDNA sequence of the invention, this sequence is an expressed 

CC sequence tag (EST) and was identified using subtractive hybridisation 
XX 

SQ Sequence 8037 BP; 1472 A; 2686 C; 2393 G; 1486 T; 0 U; 0 Other; 



Query Match 



99.2%; Score 7973.2; DB 7; Length 8037; 



Best Local Similarity 99.7%; Pred. No. 0; 

Matches 8003; Conservative 0; Mismatches 3; Indels 18; Gaps 1; 

35 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

1 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 60 

95 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 

M I I II I I I I I I I I II I I I I I I I I I I I I I I I II I I II I II I I I II I! II I I I I I I I I I I I 
61 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 12 0 

155 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCG 214 

I I M I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

121 GG GCT GC GAC AGAAGAAG C C C AC CAT CT C C GT GAAG GAAGT C C CCT T C T AC AC AGC GGC G 180 
215 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

I I I I I I I I 1 I I I I 1 MINI I I I I I I II I I I I M I I II 

181 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 24 0 

27 5 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

| | I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I 
241 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 300 

335 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 3 94 

| | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
3 01 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 360 

395 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 454 

| | | M | | | I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I M I I I I M I I I 
361 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 42 0 

455 CAC CT GGAC AGAT C C ACAGT GT CTTCCTTCTCT CT GGACT C GGT GGC C AGAAAC C C GCAG 514 

| | | | | | | I M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 1 I I I I 
421 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 4 80 

515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 574 

| | I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 
481 GAGCTCTGGCGTTTCCTGACGCA7WVCTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 54 0 

575 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 634 

I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I 

541 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 600 
635 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 694 

|| | | | || I I I I I I I I I I I I I I I I I I I I I I I I I I I M II II I I I II I I I I I I I I I I I I I M 

601 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 660 
695 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 7 54 

I II I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I 

661 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 720 
755 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 814 

I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I 

721 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 7 80 



815 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 874 
I I I I II II I I I I II I I I I II I I I II I I I I I I I I I I I I I M I I M I I I II I I I I I I I I I I I 
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Qy 
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781 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 84 0 

875 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 934 

I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
841 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 90 0 

935 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 994 

I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

901 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 960 

9 95 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1020 

1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

I I II I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 
1021 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 108 0 

1115 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 117 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1140 

1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 12 34 

I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1141 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 12 00 

1235 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 12 94 

I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 12 60 



1295 



1261 



1355 



AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

II I I II I I I I I I I II I I I I II I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCTTGGGCTTCACG 132 0 



AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCC7W5lATC 1414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1321 AGCAAGAAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 138 0 

1415 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 14 7 4 

I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

1381 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 14 4 0 

1475 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1500 

1535 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1501 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1560 

1595 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I II I I I I I I I I 

1561 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1620 

1655 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

1621 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 168 0 
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AT T GAC AAC GCGGCCTGCGGCTG GAT C C AGT T CAT GT C CAAG GT GAG C GT GGACAT CT T C 1774 

I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I M I M I 1 I I I I M I I I 

AT T GAC AAC GCGGCCTGCGGCTG GAT C C AGT T CAT GT C CAAG GT GAG C GT GGAC AT CT T C 174 0 

AAG GGCTTCCCC GAC GAG GAG AG CAT T G T C AAC T AC AC C C T C AAC C AG G C C T AC C AG GAC 1834 

I I I I I I I I I I I I M I I I I I I I I I I M I I II I I I I I I I I I I I I M I I I I I I I II I I I II I I 

AAG GGCTTCCCC GAC GAG GAG AG CAT T GT C AAC T AC AC C C T C AAC C AG G C C T AC C AG GAC 18 00 
AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 1894 

I I I I I I II I I I I I I I I II I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I 

AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 1860 
CACGT GCACTACAAGAT CC GC CAGAACT CCAGCTT CACCGAGAAAAC CAACGAGATC CGC 1954 

I I I I I I I II I I I I I I I I I M I M I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 

C AC GT G C AC T AC AAG AT C C G C C AGAAC T C C AG C T T C AC C G AGAAAAC C AAC G AGAT C C G C 192 0 

CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2 014 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 198 0 

GT CT G GAT C C AG GAC AT GAT G GAG C G C GC C AT CAT C GAC ACT T T T GT GG G GC AC GAC GT G 2 074 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GT C T GGAT C CAGGACAT GAT GGAGC GC G C CAT CAT C GAC AC T T TT GT G GGGC AC GAC GT G 2040 

GT G GAG C C AG G C AG C T AC GT G C AG AT GT T C C C C T AC C C C T G C T AC AC AC G C GAT GAC T T C 2134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GT G GAGC C AG GCAG CT AC GT G C AGAT GT T C C C CT AC C C CT G C T ACAC AC G C GAT G ACTT C 2100 

CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2194 

I | | | | I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I 
CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2160 

GC CAT GAC CAT C CAGC ACAT C GT G GC GGAGAAGGAGCAC C GGCT CAAG GAGGT GAT GAAG 2254 

II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I 

G C CAT GAC CAT C CAGC AC AT C GT GG C GGAGAAG GAGCACC G G CT CAAG GAGGT GAT GAAG 222 0 

ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

| | | | || | | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I 
ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 228 0 

CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2374 

M I I I I I I I I I I I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I M I I 

CT GT C C AT CT C C GT GACAGC AC T C AC CG C CAT C CT GAAGT AC G GC C AG GT G CT T AT G CAC 234 0 

AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2434 

| | | | | I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I M 
AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2400 

TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2494 

I || | || | | I | | | | | I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I I I I M I I I I I I I I 
TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 24 60 

ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 2554 

I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 2 520 



2555 GATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGT 2 614 

| | | I I I I I I I M I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I II I I 

2521 GATAAGAT CACGGC CTT CGAGAAGTGCAT CGCGT CCCT CAT GT CCACGAC GGC CTTT GGT 2580 
2 615 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2674 

M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I II I I I I I I I I I I I I I I I 

2581 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2 64 0 

2675 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2734 

| | | I I I I I I I I I M | I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
2 641 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 27 00 

2735 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2794 

M I I I II I I I I I I I I I I I I I M I I I I I I I II I I II I I I I I I I I I I I I I I I II I I I I I I I I 
27 01 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 27 60 

27 95 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2 854 

MUM I | I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I II I I I I I I I I 

2761 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2820 

2 855 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2 914 

M | | | I I I I I I I I I II I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I M I 
2 821 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2 8 8 0 

2 915 AT G GAGGAGGAC C AG G C CT GT GCC AT GGAGAGC CGG CGCT T T GAGGAGAC C C GT GGC AT G 2974 

| | | | M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I II I I I I I 

2 8 81 AT GGAGGAG GAC C AG G C CT GT G C CAT GGAGAGC CGGCGCTTT GAGGAGAC CC GT G GC AT G 294 0 

2975 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3034 

| M | | | | | | | | | | | II I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2941 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 300 0 

3035 AAG GAC GAC AAGAAG CTGGCCCT GAACAAG CT G AGC CT GAAC C T CT AC GAGAAC C AG GT G 3094 

I I I M I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

3001 AAGGACGACAAGAAGCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTG 3060 

3095 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 3154 

Ml I I I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I M I II I I I 

3061 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 312 0 

3155 CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 3214 

I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

3121 CT GT T C C CT C CAAC GT C GGGT T C C GC C AC C AT CT AC G G GC AC GACAT C C GCAC G GAGAT G 318 0 
3215 GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 327 4 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I 

3181 GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 324 0 

327 5 ACGGT GGAGGAACACCT CT GGTT CTACT CACGGCT CAAGAGCATGGCT CAGGAGGAGAT C 3334 

|| | | | | | | | | I I I I II I I I I II I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I 
3241 AC GGT GGAGGAACACCT CT GGTT CTACT CACGGCT CAAGAGCATGGCT CAGGAGGAGAT C 3300 

3335 CGCAGAGAGATGGACAAGATGAT CGAGGACCTGGAGCTCT CCAACAAACGGCACTCACT G 3394 

I I M I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I M I 

3301 C G C AG AG AG AT G GAC AAG AT GAT C GAG GAC C T G GAGC T CT C C AAC AAAC G G C AC T C AC T G 3360 
3395 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 3454 



3361 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 3420 

34 55 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 3514 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I II I I M I I I M 

3421 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 348 0 

3515 GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCAC 3574 

| | I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

3481 GCCAT CT GGGAC CT CAT CCTGAAGTACAAGC CAGGCCGCAC CATC CTT CT GT C CACCCAC 354 0 
3575 CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTC 3634 

| | I I I I I I I I 1 I I I I I I I I I I I I I I II I I I II I I I I I I I ! I I M I I I I I I M 1 I I I I I 1 I 

3541 CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTC 360 0 

3635 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3694 

M I I I I I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I 

3601 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3660 

3695 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 3754 

| | | | I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3661 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 3720 

3755 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 3814 

I I M I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I 

3721 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 37 80 

3815 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 3874 
I I I I I I I I I I I I II I I I I I I I I I I I II II I I I I I I I I I I I I M I I I I I I I I I I I 

37 81 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 384 0 

3875 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I 

38 41 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3900 

3935 GATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTC 3994 

| | | | I I I I I I i I I I I I I I I I I I ! I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I II 

3901 GAT GC ACT G C AC CT C AGCAGCT T C GGGCT GAT GGAC AC GAC C C T G GAG GAAGT GT T C CT C 3960 

3995 AAGGT GT CGGAGGAGGAT CAGT CGCT GGAGAACAGT GAGGCCGAT GT GAAGGAGT CCAGG 4054 

I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 

3961 AAGGT GT CGGAGGAGGAT CAGTC GCT GGAGAACAGT GAGGCCGAT GT GAAGGAGT CCAGG 4020 

4 055 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4114 

| I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 021 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4 0 8 0 

4115 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 4174 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I 
4 081 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 414 0 

4175 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4234 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I 
4141 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4200 

4235 T T T GAT AAC C C AC AG GAC C C AGAC AAT GT C AG C CT GCAAGAG GT G GAG G C AG AG GC C CT G 4294 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
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TTT GATAAC C C ACAGGAC C CAGAC AAT GT CAGC CT GCAAGAGGT GGAGGCAGAGGC CCT G 4260 

TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4354 

| I I I I I I | I | M M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 432 0 

CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4414 

I I I I I I M I I I! I I I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I M M 

CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 438 0 

CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4474 

I I I I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 44 4 0 

GAGAT T GGT GAT CT G CCCCCGCTG GT C CT GT C AC CT T C C C AGT AC CACAACT AC AC C CAG 4534 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
GAGAT T G GT GAT CTGCCCCCGCT GGT CCT GT CAC CT T CC C AGT AC CACAACT AC AC C CAG 4 500 

CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4594 

| | I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M 
CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4560 

TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4654 

| M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4 62 0 

GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4 68 0 

AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 4774 

I I I I I I M I II I I I I I M I I I I I I I II I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I I 
AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 474 0 

ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4834 

| || | | | I || I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I I 

ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4 800 

TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 4 894 

I M I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I 

TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 4 8 60 

GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4954 

I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I II 

GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4 92 0 

TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 5014 

| I I I II I I I I I I II I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 4 9 8 0 

C C C C AGAT GCGGGTGGT C AC AGGC GAC AT CCT GAC C GAC AT CAC C G GC C AC AAT GT CT CT 5074 
| | I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
C C C CAGAT GCGGGTGGT CAC AG G C GAC AT CCT GAC C GAC AT C ACC GGC C ACAAT GT CT CT 5040 

GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5134 

I M | I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I 

GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5100 



Qy 


5135 


Db 


5101 


Qy 


5195 


Db 


5161 


Qy 


5255 


Db 


5221 


Qy 


5315 


Db 


5281 


Qy 


5375 


Db 


5341 


Qy 


5435 


Db 


5401 


Qy 


5495 


Db 


5461 


Qy 


5555 


Db 


5521 


Qy 


5597 


Db 


5581 


Qy 


5657 


Db 


5641 


Qy 


5717 


Db 


5701 


Qy 


5777 


Db 


5761 


Qy 


COOT 

30*3 / 


Db 


5821 


Qy 


5897 


Db 


5881 



GG7WVCGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I MIIM 

GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5160 

AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 5254 

| I I I I I I I I I I I I I I I I I I II I I I I I M I I I M IN 

AAGAT C GC G GT G C GCAGGG C T G CC CAGGTT T T CT ACAACAACAAGG G CT AT C AC AG CAT G 522 0 

CCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAG 5314 

I | | | | | | | | | | I | I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I t I I M I I II I I I 

C CCAC CT AC CT CAACAGCCT CAACAACGCCAT CCT GCGT GCCAAC CT GC CCAAGAGCAAG 5280 

GGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCC 537 4 

I I I I II I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I 

G GC AACC C GG C GG CT T AC GGC AT C AC C GT CAC CAAC CAC C C CAT GAAT AAGAC C AGC G C C 534 0 

AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 5434 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AG C CT CT CC CT GGAT T AC CT G C T G C AG GGC AC GGAT GT C GT CAT C GC C AT CT T CAT CAT C 54 00 

GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 5494 

I I II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I M 

GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 54 60 

AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 5554 

I I I M I I M I I I I I I I I I I M I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAG G C C AAGC AT C T GC AGT T T GT C AGC G G C T G CAAC CC CAT CAT CT ACT G G CT GG CGAAC 5520 

T AC GT GT G G G AC AT GCTCAACTACCTGGTCCCCGCTACCTGC 559 6 

| | M | M | I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

TACGTGTGGGACATGCCGCCCCCACCCCTGCAGCTCAACTACCTGGTCCCCGCTACCTGC 558 0 

TGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCT 5656 

| | | | | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II I I I I I I I I I 
TGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCT 5640 

GCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCC 5716 

M | I I I I I II I I I I I I I I I I I I II I I I I I I I I I M I I I II I I I I I I M I I I I I I I I I I I I 

GCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCC 5700 

TCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTC 5776 

| | | | | | | | | | | | | | | | | I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I M I I I I I I I I I 
TCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTC 57 60 

ATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGAC7\AGGAC 5836 

M I I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
ATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGAC 5820 

CTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCT^ACTACAACCTG 5896 

| I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I 
CTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTG 58 80 

GGC CAC G G GCT CAT G GAGAT G G C C T AC AAC GAGT AC AT CAAC G AGT ACT AC G C C AAG AT T 5956 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I M I I I I I I I I I I M 

GGC CAC G G G C T CAT G GAGAT G G C C T AC AAC GAGT AC AT CAAC G AG T AC T AC G C C AAG AT T 5940 



Qy 5 957 G GC CAGT T T GACAAGAT GAAGT C CC C GT T C GAGT GGGAC ATT GT CAC C C GC G GACT G GT G 6016 

I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I | | | | | || M II I I II I I I I I I I I 
Db 5941 G G C C AGT T T GACAAGAT GAAGT C C C C GT T C GAGT G GGACATT GT CAC C C GC GGACT G GT G 6000 

Qy 6017 GCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTC 6076 

I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I | I I I 
Db 6001 GCCATGGCGGTTGAGGGCGTCGTGGGTTTCCTCCTGACCATCATGTGCCAGTACAACTTC 6060 

Qy 6077 CTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTG 6136 

I M I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I II I I I I I | | | | | 
Db 6061 CTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTG 6120 

Qy 6137 GC CAGT GAGC G G C AG C GAGT G C T C C G GGGAGAC GC C GACAAT GAC AT G GT CAAGAT T GAG 6196 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II 
Db 6121 G C CAGT GAG C GGC AGC GAGT G CT C C G GGGAGAC GC C GACAAT GAC AT G GT CAAGAT T GAG 618 0 

Qy 6197 AACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTG 6256 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6181 AACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTG 624 0 

Qy 6257 TGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAG 6316 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M | | | | | | 
Db 6241 TGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAG 6300 

Qy 6317 AC C AG CAC CTT CAAGAT GC T GAC C GG CGAC GAGAG CAC GAC GG G GGG C GAGGC C T T C GT C 637 6 

I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 6301 ACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTC 6360 

Qy 6377 AATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCG 6436 

I I M I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 6361 AATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCG 6420 

Qy 6437 CAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGG 64 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I | I I I I | 
Db 6421 CAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGG 64 8 0 

Qy 6497 CTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTG 6556 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6481 CTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTG 6540 

Qy 6557 GAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAG 6616 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I I 

Db 6541 GAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAG 6600 

Qy 6617 CTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACC 667 6 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 6601 CTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACC 6660 

Qy 6677 ACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAG 673 6 

M I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | | | | | | | || | | | | | | | | | | | | | | | | | | | 

Db 6661 ACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAG 6720 

Qy 6737 AC AG GG C GT T CAGT G GT GCT GAC AT CAC AC AG CAT G GAGGAGT GC GAG G C G C T GT G CAC G 6796 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6721 ACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACG 6780 

Qy 67 97 CGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAG 6856 



Db 


6781 


Qy 


6857 


Db 


6841 


Qy 


6917 


Db 


6901 


Qy 


6977 


Db 


6961 


Qy 


7037 


Db 


7021 


Qy 


7097 


Db 


7081 


Qy 


7157 


Db 


7141 


Qy 


7217 


Db 


7201 


Qy 


7277 


Db 


7261 


Qy 


7337 


Db 


7321 


Qy 


7397 


Db 


7381 


Qy 


7457 


Db 


7441 


Qy 


7517 


UD 


/DUl 


QY 


7577 


Db 


7561 


Qy 


7637 



1 1 1 II II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAG 



6840 



AAC CG GT T T GGAGAT G G CT AC AT GAT C AC GGT GC G GAC CAAGAG CAGC C AGAGT GT GAAG 6916 

II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAC C GGTT T G GAGAT G GC T AC AT GAT CAC GGT GC GGAC CAAGAG C AG C C AGAGT GT GAAG 6900 

GACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCAC 6976 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I > I I I I I INI 

GACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCAC 6960 

ACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAG 7036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I II I I I II 
ACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAG 702 0 

ATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTG 7 096 

I I I I M I I I I II I II I I I I 1 I I I I I I I I I I I I I I I I I ! I I I I II I I I I I I I I I I I I I I I I 

ATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTG 7 080 

GAC AAT GT GT T C GT GAAC T T T G C C AAG AAG C AGAGT GAC AAC CT G GAG C AG C AG GAGAC G 7156 
I I I I I I I II I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I 
GACAAT GT GTT CGT GAACTTT GCCAAGAAGC AGAGT GACAAC CT GGAGCAGCAGGAGACG 7140 

GAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGG 7216 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I II I I I I I I I I I I I 

GAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGG 72 00 

TCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAG 7276 

I | | | || | I I II I I I I I I I I II I I I I I II I I I I I I II I I I I I I I I I I I I I I I M I 

TCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAG 7260 

GACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACG 7336 
| | I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACG 7320 

CT CT G CT GAC CAC C C AGAGCT GG GCC AG G GAGGACAC GC T C C ACT GAC C ACC C AGAGCT G 7396 

I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
CTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTG 7 3 80 



GGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGA 
| | I I | I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
GG C CAGGGACT CAACAAT G GGGAC AGAAGT C C C C CAGT G C CT GC CAGGG C CT GGAGT G GA 



7456 



7440 



GGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTC 7516 

I | | | | | | I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I II I I I 

GGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTC 7500 

ACTGCGGTTGCCGCCCCTAATTGTGCC7WVGGCTGACCCGGCCCGGGCTGCGTACACCCT 7576 
I I I I I I I I I I I I I I I I I I I 1 I I I i I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I M I I I I I I 
ACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCT 7560 

TGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTG 7636 

| | I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTG 7 620 

CTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCC 7696 
| | | | I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I M I I I I I I I I 



Db 



7621 CTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCC 768 0 



Qy 


7697 


Db 


7681 


Qy 


7757 


Db 


7741 


Qy 


7817 


Db 


7801 


Qy 


7877 


Db 


7861 


Qy 


7937 


Db 


7921 


Qy 


7997 


Db 


7981 



TCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGA 7756 

I M I I I I I I I I I I II II I M I I I I I I I I I M I I I I I M I II I I I I I I I I I I I 

TCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGA 7740 

GCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCT 7816 

| | | | I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCT 7 800 

GCAGGGAGGT GGCTGT CCCGCGGGAAGCCATCAGCTT GGGCCAGCTGGCAGGT GGCAGGA 787 6 

I | I I I I II M I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I i M I I I I I I I I I i I 

GCAGGGAGGT GGCTGT CCCGCGGGAAGCCATCAGCTT GGGCCAGCTGGCAGGT GGCAGGA 7 860 

ATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGC 7 936 

M I II I II I I I I I I I I I I I I I I I I M I I I I I II I I M M I I I I I I I I I I I M I 

ATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGC 792 0 

CATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGT 7 996 

I I I I I I I I I I I I I II I I I M I II I I I I I I M I I I I I I II I I I I II 

CATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGT 7980 
ACAT AGC G CAC AGAT GT T T GT T T TAAAT AAAT AAACAAAAT GT C 8040 

I | II I I I I I I I I I I II I I I I I I I 1 I I I I I I I I I I I I I M I I I II 

A r AT ARH GC AC AGAT GT TT GT TTT AAAT AAAT AAACAAAAT GT C 8024 
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PT Polypeptides of human transporters and ion channels, useful for 
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PS Claim 12; Page 181-183; 204pp; English. 
XX 

CC The invention relates to human transporters and ion channels (TRICH) and 

CC their corresponding nucleic acid sequences. TRICH is useful for screening 

CC an agonist/antagonist that modulates its activity. TRICH is useful as an 

CC immunogen for preparing antibodies which are useful for diagnosing a 

CC condition of disease associated with its expression in a subject, and for 

CC detecting and purifying it from a sample. TRICH DNA is useful as probe or 

CC a primer for assessing toxicity of a test compound. Composition 

CC comprising TRICH or its agonist is useful for treating a disease or 

CC condition associated with decreased expression of functional TRICH and 

CC composition comprising TRICH antagonist is useful for treating a disease 

CC or condition associated with TRICH overexpression of TRICH. TRICH 

CC sequence is used in the diagnosis and treatment of transport disorder 

CC e.g. diabetes mellitus, angina, Alzheimer 1 s disease; neurological 

CC disorder e.g. epilepsy, stroke, Huntington's disease, bacterial and viral 

CC meningitis, muscle disorder e.g. myocarditis, infectious myositis, 

CC arrhythmias, asthma, immunological disorder e.g. acquired 

CC immunodeficiency syndrome (AIDS), allergies, atherosclerosis; and cell 

CC proliferative disorders e.g. cirrhosis, hepatitis, psoriasis and cancers. 

CC TRICH DNA is used in gene therapy. TRICH DNA is useful for creating 

CC knockin humanised animals (pigs) or transgenic animals (mice or rats) to 

CC model human disease. The present sequence is human TRICH cDNA 

XX 

SQ Sequence 7610 BP; 1379 A; 2541 C; 2302 G; 1388 T; 0 U; 0 Other; 

Query Match 93.6%; Score 7529.2; DB 6; Length 7610; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 7531; Conservative 0; Mismatches 3; Indels 0; Gaps 0 
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Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 77 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 136 



Qy 


61 


GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 
ill! i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i I I I I I I I I I I I 1 

I | | | | | | M 1 1 1 1 M II 1 II 1 II 1 1 1 II II 1 1 II 1 1 11 1 II 1 1 1 M 1 I I 1 M M M I i i 1 

GCTGCTCTGGT^AGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 


120 


Db 


137 


196 


Qy 


121 


CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i I I I I I 1 t I I I I 1 

I I I I I I I I I M M M 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 I I I I M I I I 1 

CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 


180 


Db 


197 


256 


Qy 


181 


CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 

, , i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i l i i i i I i i i i I I 

I I I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II I 1 1 1 1 1 M 1 1 1 1 

CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 


240 


Db 


257 


316 


Qy 

Db 


241 

317 


T GT C AT GC AAT CGCTGTGCCCG GACGGC CAGC GAGAC GAGT T C GG CT T C CT GCAGT AC GC 

• 1 i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i \ i i i i i i i i i i 

| || | | | | | | M I I I 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 


300 
376 


Qy 


301 


CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 
i , i j i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I I 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 II M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 


360 


Db 


377 


436 


Qy 


361 


GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 
i » i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I | | | | | | M 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 


420 


Db 


437 


496 


Qy 


421 


GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 
, , . , , , i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I I 1 M 1 1 1 1 1 II 1 M 1 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 

GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 


480 


Db 


497 


556 


Qy 


481 


CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGC7\AAA 

, i i i i i i i i i i i i i i i ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 

CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 


540 


Db 


557 


616 


Qy 


541 


CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 
* i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 


600 


Db 


617 


676 


Qy 


601 


GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 
. iiii i i i i i i i i i i i i i i i i i t i i t t i i i i i t i i i i i i i i i i i i i 

I | || I I I I I I I 1 1 II 1 1 1 1 II 1 1 1 1 II M 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 


660 


Db 


677 


736 


Qy 


661 


GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 

i i i i i i i i t i i i i i i i i i i i i i i i i i i i I I I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 I I 1 1 ! 1 1 1 1 1 1 1 1 1 1 

I || II M 1 II M 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 


720 


Db 


737 


796 


Qy 

Db 


721 
797 


GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 

i , i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 M M 1 1 1 

GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 


780 
856 


Qy 


781 


GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 

M | I I M M I I 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 

GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 


840 


Db 


857 


916 


Qy 


841 


CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 

1 I 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II II 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M M 
CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 


900 


Db 


917 


976 



901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

| | | M I I I I I I I I I I I I I I I I I I I I M I I I i I I I M I I I I I I I I I I M I I I I I I I I I I I I 

977 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1036 

961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

| | | | | | I I I M I I I I I I I I I I I > M I I I I I I M I I I I I I I I II I I I I I I I I I I I I 

1037 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1096 

1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

| | I I I I I I I II I I I I I I I I I I I I I I I I M II I I I I II I I I I I I I I I I M I I I I I I I I I I I 
10 97 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1156 

10 81 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

| M II I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I 

1157 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1216 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

| | | | | | | | | || | | | | I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I M 
1217 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1276 

12 01 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

| | | | | | | | | || | I I I I I I I I I II I I II I I I I I I M I I I I I I I I I I I I I I I I I H 

1277 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1336 

12 61 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

Ml || II II II li I I I II I I I I I IN M I I I Ml II I I I N II I I I I I I M I I M Ml I I 

1337 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1396 
1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

| 1 | | | M | | I I I I I I M I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1397 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1456 

1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
1457 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1516 

1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I M I I I I I I I I I I I I I M I I I I I I I I I I II I I II I I I I I I I I II II I I I I I I I I I I I I 

1517 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 157 6 

1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

| | | | I I I I I I I II I I I I II I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I I M I I I I I 
1577 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1636 

1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

| | | | I I I I I I I I I II II I II II I II I Ml I I I I Ml I I Mill II II I I I I I II I MM I 

1637 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1696 

1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

| | | | | | | | I I I I I II I II I I II II I I I I I I I I I I I I I M M I I I II I I I I I I M I 

1697 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1756 

1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

I I I I I I I I I I I M I M I I I II I I I M I I I I I I II I I M I I I I I I I I M I I I I I I I I I I I I 

1757 C AGT G G CAT GGCCCTCCTG C AG C AGC T G GAT AC CAT T GAC AAC GCGGCCTGCGGCT GG AT 1816 
1741 CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 18 00 



1817 C C AGT T CAT GT C CAAGGT G AGC GT GG AC AT CT T C AAG G G CT T C C C CGAC GAG GAGAG CAT 187 6 

1801 T GT CAACT AC AC C C T C AAC C AG G C CT AC C AG G AC AAC GT CAC TGTTTTTGC C AGT GT GAT 1860 

| | | | | | | | | | | | | | | I I I II I I I I I I I I I I I I I I I I I I M I I I I I I I I i I I M I I I I I I I 
1877 T GT C AAC T AC AC C CT C AAC C AGGC CT AC C AG GAC AAC GT C ACT GT T T T T GC C AGT GT GAT 1936 

1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I 

1937 C T T C C AGAC C C G GAAG GAC GGCTCGCTCCCGCCT CAC GT GC AC T AC AAGAT C C GC C AG AA 1996 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

I | | | | I I I I II I I M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1997 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2056 

1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2040 

I I I M I I I I I I I I I I I I I I I I I II II I I I I II II I I I mini 

2057 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2116 

2041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

| | | | I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I I 
2117 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 217 6 

2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I Ml I I I I I I I I 

2177 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2236 

2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

I I I I I I I I III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I 

2237 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 22 96 

2221 G GAG AAG GAG CAC C G G C T C AAG GAG GT GAT GAAG AC CAT G G G C C T GAAC AAC G C G GT G C A 2280 

I I I I I III I Ml I III I I I I I I I I II M I I M I I Ml I I I I I I M II I 

2297 GGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCA 2356 
2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I | | | | || | I I II II M II I II II I I I II I I I I II II I III II I I II I II III I I I II I I I 

2357 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2416 
2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I | M II II II II II I II I I II II III II III I I II I M I II M II II II II I I I 

2417 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2476 
2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 60 

|| || || I II I I II II I II I I I II I I I II I I I MM M I II II M II I 

2477 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2536 

2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 252 0 

I I I II I I II II I II II II I I M I ! M M II M I I M M I I I M 

2537 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2596 

2521 CAT GT AC GT GGC GAT C C GAGAGGAG GT G G C GC AT GAT AAG AT C AC GGC CT T C GAGAAGT G 2580 

I I I I I I I I M M I I I I I I M M II II II I II II II I 

2597 CAT GT AC GT G G C GAT C C GAGAGGAG GT GG C G CAT GAT AAGAT CAC GGC CT T C GAGAAGT G 2 656 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 64 0 

I I M I M II II I I I IIIIIMIIIIIIIIIIIIIIIIIIIIIIIMIIMIII 



2657 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2716 
2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 27 00 

I I I I I I I I I 1 II II II I I II I I Ml I I I MINIMI 

2717 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 277 6 
27 01 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

I I I I I I I I M I I I I M I I I I I I I I M M I M I I I I I I I I I M M I I I I I I 

2777 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2 83 6 

27 61 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

M M I II M M M M M M II II IN M II M M M M II M M I M I 

2 837 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 8 96 

2821 CTTCCCACTGCAG7^AGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 8 8 0 

I I || M I I II I I I II M I I I I I I I I I I I I I I I I M II II I II I I I I I I I I M I I 

28 97 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 956 

2 8 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 940 

M I I I I II I I I I I I I I I M I I I II II I I I I II I I I I I I I I I M I I I 1 I I I I I I I I 

2957 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3016 

2 941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3 000 

| | M I I I I II I I I I I M I I I I I I I I M I I I M I I I M I I I I I M 

3017 G GAGAGC C GG C G CT T T GAG GAGAC C C GT GG CAT GGAGGAGGAGCC CAC C CAC CTGCCTCT 3076 

3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I M I I I I 

3 077 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3136 

3 0 61 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 312 0 

| | | | | M II I I I I I I M I I I I M I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I M I I 
3137 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3196 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

| | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I M I I 
3197 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3256 

3181 CAC CAT CT AC GGGC AC GACAT CC GCAC GGAGAT GGAT GAGAT C CGCAAGAAC CT G GGC AT 3240 

| | | | | M I I I II I I I I I I I I M I I I I I I I I I M I I I M I I I I I I M I I I I M I I I I I I M 
3257 CAC CAT CTACGGGCAC GACAT C C GCAC GGAGAT GGAT GAGAT C CGCAAGAACCT GGGCAT 3316 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I || M I I I M II II I I I I M II I II I I I I M I I I I I I I I I I I II II I I I 

3317 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3376 

3301 CT CAC GGCT C AAGAG CAT G GC T C AGGAGGAGAT C C GC AGAGAGAT GG AC AAGAT GAT C GA 3360 

I I I I M I I I I I I I I M M I I M I I II I II I I II M I I I I I I I I I I I I M I I M II II I I I 

3377 CT CAC G GCT C AAGAGCAT GGCT CAGGAGGAGAT C CGCAGAGAGAT GGACAAGAT GAT CGA 3436 

3361 G G AC C T G GAG CT CT C C AAC AAAC GGCAC T C ACT G GT G C AGAC AT T GT C GG GT G G CAT G AA 3420 

| | | | | M I I I I II I II I I I I M I I I I I I I I I I M I I I I I II I I I M I I I M I I I I I I I M 
3437 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3496 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3480 

M I M M I I M M I I M M I I M I M I M M M I M M I I M M M M I I II M M I I I I 

3497 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3556 



3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

| | | M | | M | | I I I I I I I I I I I I II I I I I I I I I I I I II M I I I I II I I II I I I I I I I i I I 

3557 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3616 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I 
3617 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3676 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

| | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 

3677 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3736 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

| I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I I I I Ill 

3737 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 37 96 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

37 97 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 38 56 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I I I I I I I 1 I I MINIMI 1 1 I I I I I I I I I I I I MMM 

3857 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3916 
3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I || || M II I I II II I I I I I I I I I I I I M I I I II I I I M II II I I I I II I I I I I I 

3917 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3976 
3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

| | | | || | || | | I I I I I II I II I I N I II I I I II I I 1 1 I I I I I I I I N I II I I I I I I I II I 

3977 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4 036 
3961 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4020 

I | | | || | | || I II II I I I I I I I II I II I I I I I I I I I I I I I I II N I M I I I I I M N II I 

4037 GCT GAT GGACAC GAC C CT G GAG GAAGT GTT C CT CAAGGT GT CGGAG GAG GAT CAGT C GCT 4096 
4021 GGAGAACAGT GAGGC C GAT GT GAAGGAGT C CAGGAAGGAT GT GCT C C C T G GGGC GGAGGG 4080 

| | II II I I I II I I I II I II I I I II I I I I I I II M II I I II I I II II II II I I I I II I I I I 

4097 GGAGAACAGT GAGG C CGAT GT GAAGGAGT C C AG GAAGGAT GTGCTCCCT G GGGC GGAG GG 4156 
4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

| | | | | || | | | | | I | I M I I I I I II I I I I I II I I I I I I I M I I I I I II I I N II I I I I I I I 

4157 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4216 
4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

| | I II II I I I II I II II I I M I II II II I I I N I I I II I I I II I I I I I I I II II I I I II I 

4217 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 427 6 

4201 C T AC AC C GAC GT C TAT G G C GACT AC CGCCCCCTCTTT G AT AAC C C AC AG GAC C C AGAC AA 4260 

I I I I ! j I I I I I I I I M I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4277 C T AC AC C GAC GT C TAT G G C G AC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AG AC AA 4 336 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 432 0 

I M I || || I I I II II II M I II I II I I I I I I M II II I I I I M I I I II I I II I I II N M 
4337 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4396 



4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ll I ll 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 

4397 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4456 
4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4440 

I | | | | || || | | | | | I I I I I I M I II I II II I I M I I I I I II I I I I I M I I I II I I I I II I 

4457 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4516 
44 41 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

| I I I I I I II I I I I I I M I II I I I I II I M I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 

4517 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4576 
4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I | | | | | | | | || | | I I I II I I I I I I I II I I I I I I I I I I I I I M I I I M I I I I I I I I I I I I I 

4577 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4636 
4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

| M II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

4637 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 696 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I II I I I I I I I I II I I I I I M I I I I I I M II I I I I II I I I I I I 

4697 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4756 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 74 0 

| | | | | | I I I I I I I I II I I II I II I I I I II I I I I I I I I I I I I 

4757 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4 816 

47 41 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 48 00 

I | | | M I I II I I I M II M I I I M I I I I I I I I I I I I I I I I I I I I I I I II 

4817 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 87 6 

48 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 8 60 

I | | | | I I I I I I II M I I II I II I II I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I 

4877 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 936 
48 61 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 92 0 

| | | | || I I I I I I I I I II I I I I I I I M I I I M I II II II I I I I I I I I I I I I I I M 

4937 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4996 

4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 498 0 

I I I I I I I I | | I I I I I I I II I I I I I i I I I I 1 I I I I I I I I I I M M I I I I I I I I I 

4 9 97 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 5056 

4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

| | I I I | | I I I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I 

5057 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5116 

5041 CAT C C T G AC C GAC AT C AC C GGC C ACAAT GT C T C T GAGT AC CTGCTCTT C AC CT C C GAC C G 5100 

| II I I I II I I I I I I I I I I I I I M M I M I I I I I I I I I 

5117 CAT C CT G AC C GAC AT C AC C GGC C AC AAT GT C T CT GAGT AC CTGCTCTT C AC CT C C GAC C G 5176 

5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

|| I I I I I I I I I 1 M I I I I I I I I I I I I M I I I II I I I I I I M I I 

5177 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5236 

5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 



5237 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5296 

5221 G GT T T T CT AC AAC AAC AAG G GC TAT C AC AG CAT G C C C AC C T AC C T C AAC AG C CT C AAC AA 52 80 

I I I M I I I I I I I I I I I I II I II I IIMIIIIIIIIIIIIIIIIIIIII 

5297 G G T T T T C T AC AAC AAC AAG G G C TAT C AC AG CAT G C C C AC C T AC C T C AAC AG C C T C AAC AA 5356 

5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5340 

II I Mill | I I I I I I I I I I I I I I I M I I M M I M I 

5357 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5416 

5341 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I 

5417 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5476 

5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

| | | | | | | | I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I M I I I I I I I I t I I I I I 
5477 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5536 

54 61 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I | | M I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I II I I I I II I I I I I I M I I I I I I 

5537 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5596 

5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

M | | I II I I I I I I II I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
5597 CG GCT G CAAC C C CAT CAT CT ACT G GCT G GC GAACT AC GT GT G GGAC AT GCT CAACT AC CT 5656 

5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

| I M I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
5657 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5716 

5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I MM 

5717 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5776 

57 01 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I M I M I I I I II I I I I II II I I I I I I II II I II I I I II II I I II II II I I I I M 

57 77 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5836 

57 61 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

I | | | | II I I I I II I I I I I II II I I M I II I II I II I II I II II I I II I II I I I M 

5837 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5896 
5821 C GAG C AC GAC AAG GAC CT GAAG GT T GT C AACAGT T AC C T GAAAAG CTGCTTCCT CAT T T T 5880 

M I II I II I I II I II I I I II I I M M I I M I II I II I II I I I II II I I II II I I M II II 

58 97 CGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTT 5956 

58 81 C C C CAAC T AC AAC CT G G GC C AC G G G CT CAT G G AGAT G GC CT AC AAC GAGT AC AT CAAC GA 594 0 

| || || II I I II II I M I I I II II I I M I I I I I II M I I I II I I M I II I I M I I 

5957 C CC CAAC T AC AAC C T G G G C C AC G G G CT CAT G GAGAT G GC C T ACAAC GAGT AC AT CAAC GA 6016 

5941 G T AC T AC G C C AAGAT T GG C C AGT T T G AC AAGAT GAAGT CCCCGTTC GAGT G G GAC AT T G T 6000 

I || I I II I II I II I I M M M II II I I M II II II II I M I II II II I I II 

6017 GT AC T AC GC C AAGAT T GG C C AGT T T GAC AAGAT GAAGT C C C C GT T C GAGT G G GAC AT T GT 607 6 

6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I | | I I I I I II I II II II I I II II I II I I M I I I I I I M I I I I II II I I M II I I I I I 1 I I 
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CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 613 6 

GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

M I I I II I I I I I I I I I M II I I I I I II I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I i 
GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6196 

GGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGA 618 0 

| | | | | | | I I I I II I I I I II I I I I I M I II I II I I I I I I I I I I I I I I I I I I I I I I 

G GAT GAT GT GGAC GT G G C CAGT GAGC G GC AGC GAGT G C T C C GGG GAGAC GC C GACAAT GA 6256 

CAT G G T C AAG AT T G AG AAC C T G AC C AAG G T C T AC AAGT C C C G G AAG AT T G G C C GT AT C C T 624 0 

| | | | | I I I M I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CAT G GT C AAG AT T GAG AAC C T G AC C AAG G T C T AC AAG T C C C G G AAG AT T G G C C GT AT C C T 6316 

GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

| | I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I II I I I I I I I I I I I 
GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6376 

C AAC G GT G C G G G C AAG AC C AG C AC C T T C AAGAT G C T G AC C G G C G AC GAG AG C AC G AC GGG 6360 

|| | | | | | | | II I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I M I II I I I I I I I 

CAAC GGT GC GGGCAAG AC C AG C AC CT T C AAGAT G CT GAC C GGC GAC G AGAGCAC GAC GGG 6436 

GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 642 0 

M I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6496 

CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6480 

I | | | | I I I I I I I I I I I I I I I I I I I II II I I I I I I I I II I I I I M I I I I I I I I I I I II I II 

CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6556 
GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 654 0 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I M I I I I M 1 I I I 

GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6616 
GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I I M I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I M I I I I I I I I M I M I I I I I I I 

GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 667 6 

CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

I I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6736 

CCTGGACGAGCCCACCACAGGCATGGACCCC/^iAGGCCCGGCGCTTCCTCTGGAACCTCAT 6720 

M I I I I I I I I I II I I I I I I I I I I 1 1 I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I 

CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6796 
C CT C GAC CT CAT C AAG AC AGGGC GT T CAGT GGT G CT GAC AT CAC AC AG CAT G GAG GAGT G 6780 

I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I 1 I I I I I I I I I I I I I I I I I M I I I I I I 

C CT C GAC CT CAT C AAGAC AGG GC GT T CAGT G GT G CT GAC AT CAC AC AG CAT G GAG GAGT G 68 56 

CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 684 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I II I I I I I I I 
CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6916 

CAT C C AG CAC CT GAAG AAC C G GT T T G GAG AT GGC T AC AT GAT CAC G GT G C G GAC C AAG AG 6900 

I II I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

CAT C CAG CAC CT GAAGAAC C G GT TT GGAGAT G GCTACAT GAT CAC G GT GC G GAC CAAGAG 6976 
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6901 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 6960 

MINI I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 

6977 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 7 036 

6961 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7 020 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I M I I I I I I I I I I I I I I I I I I I 
7 037 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7096 

7 021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7 080 

| | M I I I II I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
7 097 C C AG GT GT T C AGCAAGAT G GAG CAGGT GT CT GG CGT GCT G G GC AT C GAGGAC T AC T C G GT 7156 

7 081 CAGCCAGAC CACACT GGACAAT GT GTT C GT GAACTTT GCCAAGAAGCAGAGT GACAACCT 7140 

M I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I 
7157 C AG C C AGAC CACACT GGACAAT GT GT T C GT GAACT T T G C C AAGAAG C AGAGT GACAAC CT 7216 

7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I M I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

7217 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 727 6 

7201 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

| | | || | || | | | I I I I II I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7277 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7336 

72 61 GGACCT GGACAC GGAGGAC GAGGGC CT CAT C AGCT T CGAGGAGGAGCGGGC C CAGCT GT C 732 0 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

7337 GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7 39 6 

7321 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 738 0 

| | | | | I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I M I I I II I I I I II I II I I I I I I 
7397 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7 456 

7381 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7440 

| | | I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I t I i I I I I I I I I I I I I I I I I i I I M M 
7457 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7516 

7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

7517 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7576 

7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCT 7534 

I I 1 I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
7577 GCCATGTCCTGCGGTCACTGCGGTTGCCGGCCCT 7610 



RESULT 7 
AAD02722 

ID AAD02722 standard; cDNA; 6792 BP. 
XX 

AC AAD02722; 
XX 

DT 31-MAY-2001 (first entry) 
XX 

DE Human ATP binding cassette2 (ABC2) transporter protein cDNA. 
XX 

KW Human; adenosine triphosphate; ATP binding cassette2 transporter; 



KW ABC2 transporter; nootropic; neuroprotective; anticonvulsant; neurotoxic; 

KW beta-amyloid; multidrug resistance; therapy; Alzheimer f s disease; 

KW prion disease; Parkinson's disease; Huntington's disease; panic disorder; 

KW cholesterol misregulation; inflammatory disease; blood brain barrier; 

KW cancer; mood disorder; ss. 

XX 

OS Homo sapiens. 



XX 

FH Key Location/Qualifiers 

FT 5'UTR 1. .90 

FT /*tag= a 

FT misc_signal 88. .94 

FT /*tag= b 

FT /note= "Translation initiation motif" 

FT CDS 91- .6096 

FT /*tag= c 

FT /product= "Human ABC2 transporter protein" 

FT /transl_except= (pos:178. .180, aa:Xaa) 

FT /transl_except= (pos:298. .300, aa:Xaa) 

FT /transl_except= (pos:928. .930, aarXaa) 

FT /transl__except= (pos:1519. .1521, aa:Xaa) 

FT /transl_except= (pos:1762. .1764, aa:Xaa) 

FT /transl_except= (pos:4501. .4503, aa:Xaa) 

FT /transl_except= (pos:5041. .5043, aarXaa) 

FT /transl_except= (pos:5155. .5157, aarXaa) 

FT /transl_except= (pos:5260. .5262, aa:Xaa) 

FT /note= "Xaa is an unknown amino acid; The coding sequence 

FT is specifically claimed as SEQ ID NO 3 in claim 1" 

FT 3 ! UTR 6097. .6792 

FT /*tag= d 

FT polyA_signal 6772. .6781 

FT /*tag= e 

XX 



PN WO200114414-A2. 
XX 

PD 01-MAR-2001. 
XX 

PF 18-AUG-2000; 2 000WO-CA000962 . 
XX 

PR 20-AUG-1999; 99US-015007 3P . 

PR 30-AUG-1999; 99US-0151457P . 

PR 17-AUG-2000; 2000US-00641040 . 
XX 

PA (ACTI-) ACTIVEPASS PHARM INC. 
XX 

PI Le Bihan S, Wilson C, Charest DL; 
XX 

DR WPI; 2001-202931/20. 

DR P-PSDB; AAY72649. 
XX 

PT Novel adenosine triphosphate (ATP) binding cassette transporter protein 

PT 2, useful as target for developing modulators that modulate activity of 

PT transporter protein and thus treat Alzheimer's disease and Parkinson's 

PT disease. 
XX 

PS Claim 1; Fig 1; 92pp; English. 
XX 



CC The present sequence is human adenosine triphosphate (ATP) binding 

CC cassette2 (ABC2 ) transporter protein cDNA. ABC2 transporter molecules are 

CC transmembrane proteins which catalyse ATP-dependent transport of 

CC endogenous or exogenous substrates across the biological membranes. ABC2 

CC transporters have been associated with the transport of neurotoxic 

CC polypeptides (e.g., beta-amyloid) and substrates across the blood-brain- 

CC barrier. ABC2 sequence is useful as target for developing modulators that 

CC are useful for modulating amyloid deposition and thus for treating 

CC Alzheimer's disease, prion diseases, Parkinson's disease and Huntington's 

CC disease. It is also useful as targets for developing modulating agents of 

CC multidrug resistance exhibited by e.g., cancer cells. ABC transporters 

CC are also useful for treating mood and panic disorders, cholesterol 

CC misregulation and inflammatory diseases. It can also be used to treat 

CC disorders characterised by insufficient or excessive production of an 

CC ABC2 transporter protein or its inhibitors. Fragments of ABC transporters 

CC are used as immunogens for producing antibodies 

XX 

SQ Sequence 6792 BP; 1271 A; 2251 C; 1997 G; 1263 T; 0 U; 10 Other; 

Query Match 83.2%; Score 6686.8; DB 5; Length 6792; 

Best Local Similarity 99.3%; Pred. No. 0; 

Matches 6748; Conservative 9; Mismatches 33; Indels 7; Gaps 4; 

TCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACC 1303 

| I I I I I I I I I I I I I I II II I I I I I M Ml I I I I I I II I I I I I I I I 

TCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACC 60 

ATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAG 1363 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAG 120 

CAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCG 1423 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I : I 

CAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGSG 180 

CCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTG 1483 

| M | | | | | | | | | | | | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I M I I I I I M I I I I I I 
CCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTG 240 

GGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTC 1543 

I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I : I 

GGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTYC 3 00 

CTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTG 1603 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

CTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTG 360 

CGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAG 1663 
I | I I I I I 1 I I I I I I I I I I II I i I I I I I I I I I I I I I I I ! M I I I I I I I I I i I M I M I I I 
C G GC C G C AC C C C GAGG C ACT GAAC C T GT CACT GGAT GAGCT GCCGCCGGCCCT GAGACAG 420 

GACAAC TTCTCGCTGCC CAGT GG CAT GGCCCTCCT GC AGC AGCT GGAT AC CAT T GAC AAC 1723 

I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I II I I I I I I 

GACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTACAGCAGCTGGATACCATTGACAAC 4 8 0 



Qy 


1244 




1 


Qy 


1304 


Db 


61 


Qy 


1364 


Db 


121 


Qy 


1424 


Db 


181 


Qy 


1484 


Db 


241 


Qy 


1544 


Db 


301 


Qy 


1604 


Db 


361 


Qy 


1664 


Db 


421 



1724 GCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTC 1783 

in 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Him 



Db 


481 


GCGCCCTGCGGCTGGATCCAGTTCAICjlL.LAACjCjlbAbUijHjijAUAiL.1 1 uah.ij>ju>~ i j.^ 


540 


Qy 


1784 


CCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACT 
| | | | | | | I I I 1 1 1 1 1 1 II MM 1 1 1 1 1 1 1 1 1 1 1 

~~-*mr^ „^ 1 »or.nmmr'nirt7\7\r'rTi7lPAr , rr r Prfl is. P P Zi P PP P T Zi P P A PP A C A A PPT C ACT 

CCCGACGAGGAGAGCATTGTCAACTACAL-bL- 1 LMLLAbbUL 1 ALLAbb^m^iai i 


1843 


Db 


541 


600 


Qy 


1844 


GTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCAC 
| | | | | 1 I I I 1 1 M 1 1 1 1 1 II 1 1 M I 1 1 1 1 1 1 1 I 1 1 M 1 1 M 1 1 1 

/ , mmmmm/ ,„„« J n )mr , mo •« m^mmn^7\n\pr , r , r , r7\ a rr 7\pr , r , P r PPPPTPPPP,PPTP APPTPP AC 
GTTTTTGCCGGTGTGATCTTCCAGACCCGGAAbbAbbbb 1 bbu i LLUbLU i <^/\^<j -l kj^^^ 


1903 


Db 


601 


660 


Qy 


1904 


TACAAGATCCGCCAGAACTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTAC 
|| | | 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 

^-»m^./-^^.^.^Tv^-n 7y/^m/-<r*7\ rrTTimr'Arr'rzirafi A ziPP A APP AP ATPPPPPPCPCCT AC 
TACAAGATCCGCCAGAACTCCAGCT i LACLbAbAAAAbbAAbbAbAi 


1963 


Db 


661 


720 


Qy 


1964 


TGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATC 

M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 Mill 1 1 1 1 1 1 1 1 1 1 

TGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCIAU1 ICUluiACCjUOl 1 1,191 Elista/til* 


2023 


Db 


721 


780 


Qy 


2024 


CAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCA 

| || M | | | | | | | I I I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACOiAutjl 1j<jA.|jU^a 


2083 


Db 


781 


840 


Qy 


2084 


GGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTC 

| | | | | | | | I I 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACALAUbUbAlijAUl ittibi ± ibi^ 


2143 


Db 


841 


900 


Qy 


2144 


AT T GAGC ACAT GAT GCCGCT GT GCAT GGT GAT CT CCT GGGT CT ACT CCGT GGCCAT GAC C 
|| || | || | | | I I II 1 II II II 1 II 1 II 1 :| 1 I! 1 1 III Ml 1 1 II 1 Mill 1 1 1 1 Ml 1 1 

™«««/-,«m/^m/^irt7v mr^ /-> \rr~> t\ rnr*rns~ i r~ i rpr''/~*/~'<Tir* r V7\ f"' r Pf'~ i fT~ ,r rPPPPATPAPP 

ATTGAGCACATGATGCCGCTGTGCATGGYGATCTCCTGGGI C lALlLLblbbLLAi 


2203 


Db 


901 


960 


Qy 


2204 


AT C C AG C AC AT C GT G G C G G AG AAG GAG C AC C G G C T C AAG GAG G T GAT G AAG AC CAT G G G C 

M 1 II II 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 

ATCCAGCACATCGTGGCGGAGAAGGAGCACCGGL. 1 CAAl^Abij J. <jA1 ijAa^al-uai ijvjuv- 


2263 


Db 


961 


1020 


Qy 


2264 


CTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATC 
| | 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

_ M _ _ _ om^/^^mr</^r<^m/^/^rnrrir , 7\frr'7\r , r , r , ( r, P r P r P r rr , TCr' Z\ PPT 1 PT 1 PP ATT 

CTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCAbbbbbl 1 Iblb^Ab^i biui^Mi ^ 


2323 


Db 


1021 


1080 


Qy 


2324 


T C C GT GAC AG C AC T C AC C G C CAT CCT G AAG T AC G G C C AG GT G C T TAT G C AC AG C C AC GT G 

1 I | | | M | I I I 1 M M 1 1 M 1 M 1 1 M 1 M M 1 1 1 1 M M M M M M 1 II M 1 M 1 1 M 

— — ^ «-r,^^ _ _ ^m^-ft /M^r'rir<T\mr , r'mr , A A rrp iv r»PPPP A PPTP PTT ATPP AP APPP ACP/TG 

TCCGTGACAGCACTCACCGCCATCCTGAAGTACbbbbAbbJ. bbl 1 Ai b^^/\bjL^/\^<jj. u 


2383 


Db 


1081 


1140 


Qy 


2384 


GTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTG 

I | | | | | | | | | | | | I I I II 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 II 1 M 1 M 1 M 1 1 1 1 1 1 1 1 M 1 1 

^ ^ _ __ _ _ r ,m^mmnnm^r'/-'7i rrn r*rn 7\ r> 1" r> r> rT C P P P ft. P P Zi. T P A T PT T PT 1 PPT T C CT G 

GTCATCATCTGGCTCTTCCTGGCAGTCTACGCGbl bbLLALLAIbAibi ibibbi i^v~±^r 


2443 


Db 


1141 


1200 


Qy 


2444 


GTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTC 
|| | | | | | | 1 || I I 1 II II II 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 M 1 1 1 

^—^.— ^rr,^ — rn^rri-JV rtm/-»/-<1\ 7\ /-« r* r* 7\ 7\ rPTrPPPrPf^rrr 1 T P PT P P P A T P AT PT ACTT C 

GTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCICbbb 1 bbibbLAi uai^i^i ± <~ 


2503 


Db 


1201 


1257 


Qy 


2504 


CT GAGC T AC GT GC C CT AC AT GT AC GT GG C GAT C C GAG AG G AGGT G G C GCAT GAT AAG AT C 

1 | | | | || | | || || I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 

CTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATC 


2563 


Db 


1258 


1317 


Qy 


2564 


ACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCT 

M II 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

; ACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCT 


2623 


Db 


1318 


1377 



2 624 AAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAG 2683 

| I I I I M I I I M I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I II I I I I I I I 

137 8 AAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAG 1437 

2684 TCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGAC 2743 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M I I M II I I I I I I I I I I 

1438 TCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGAC 1497 

27 44 GCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGG 2803 

MINIMI : I 1 I I I I 11 I I I I I 1 M M I I I I I MINIMI 

1498 GCCGTGGTCTATGGCATCCTCMCGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGG 1557 

2 8 04 CTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACA 2863 

M I I II I II M I II II I M I I I II II II I I M I M II I II I M II M M II II II II I II 

1558 CTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACA 1617 
2864 GAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAG 2923 

I || M I M I I I I I II I II I I I I I II I M M II I II II I M I I II II II II I M I I II II I 

1618 GAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAG 1677 

2 924 GAC CAGG CCT GT GC C AT G GAGAGC C G GC GC TT T GAGGAGAC C C GT GGC AT G GAGGAGGAG 2 9 83 

|| M I I I I II II I I I M II I II II II I I I II II I 

1678 GAC C AGGCCT GT GC C AT G GAGAGC C GGCGCTTT GAG G AGAC C C GT GGC AT GGAGGAG GAG 1737 

2984 CCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGAC 3043 

| M I I I M M II I I I I I I M M II I : I II I I I M I I M I II I I M M I II M M I 

1738 CCCACCCACCTGCCTCTGGTTGTCTKCGTGGACAAACTCACCAAGGTCTACAAGGACGAC 1797 

3044 AAGAAGCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTC 3103 

|| | | || || II I M I I II I II M II I I I M I M I II I I M II II I I M II II I I 

17 98 AAGAAGCT G GC C CT GAACAAG C T GAG CCT GAACC T C T AC GAGAAC C AGGG GGT CT C CTT C 1857 

3104 TTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCT 3163 

| | | M II I M II I II II M I I I I M II II I II I II II I M I I II II M M I II II 

1858 TTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCT 1917 

3164 C C AAC GT CGGGTTCCGC C AC CAT CT AC GGGC AC GAC AT C C GC AC GGAGAT GG AT GAGAT C 3223 

|| I I II II I I II I II M I II M II II II II II I Ml I I M II I II II II II M M M I I I 
1918 C CAACGT CGGGTT CC GC CACCAT CT AC GGGCACGACAT CC GCACGGAGAT GGAT GAGAT C 1977 

3224 CGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAG 32 83 

| || I II II I II M M I II I II I I I II II M I I I I II I II I I I I II M M I I I 

197 8 C GC AAG AAC — GG G CAT GT G C C C - C AG C AC AAT GTGCTCTTT GAC C GG CT C AC GGT GG AG 2034 

32 84 GAACACCTCTGGT T CTACT CACGGCT CAAGAGCATGGCTCAGGAGGAGAT C C GCAGAGAG 3343 

M II II II I I I I II I M M M II II I I II I II M I I M I I II I I I II I M II II M I I I 
2 035 GAAC AC C T CT G GT T CTACT C ACG GCT C AAGAGC AT G GCT C AGGAGGAGAT C C C C AGAG AG 2094 

334 4 AT GGACAAGAT GATCGAGGAC CT GGAGCT CT CCAACAAAC GGCACT CACT GGT GCAGACA 3403 

| | M | || I II II I I I I I II M II II I I I I I I M I I II I I I I I I I II II I I II I II M M I 
2095 AT G GACAAGAT GAT C GAGGAC CT GGAG CT CT C CAACAAAC GGCACT CACT GGT GCAGACA 2154 

34 04 TTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGC 34 63 

|| II I II II M I I I I I I II II II I I I I I I I II I I I I I I I I I I I II I II II I I M M I I I 

2155 TTGTCGGGTGGCATGAAGCGCAAGGTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGC 2214 



3464 GCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGG 3523 

| | | | | | | | | | | | | | | | I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I I I M I 
2215 GCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGG 2274 

3524 GAC CT CAT C CT GAAGT AC AAG C CAG GC C G C AC CAT CCTTCTGTC CAC C C AC CAC AT G GAT 3583 

| | | | | | | | | | | | | | | | | I I I I II II I I I I I I I I I I II I I I I I I I I I M II I I I I I I I I M 
227 5 GAC CT CAT C CT GAAGT ACAAGC CAG G C C G CAC CAT C CT T CT GT CCAC C CAC C ACAT GGAT 2334 

3584 GAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGC 3643 

| | | | | | M M | | | | | | I I I I I I I I II I I I I II I I I I I I I II I I I I I I I I M I I I I M I I I 
2335 GAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGC 2394 

3644 GGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAG 37 03 

| | | || | | | | | || | | | | I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I Ml 

2395 GGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAG 2454 

37 04 CGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGG 3763 

| | | | M | | | | | | | I I I I I I M I I I I I I I I I I I I I 1 I I I I I 1 I I I I I I I I M I I I I I I I I I 
2455 CGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGG 2514 

3764 GCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCC 3 82 3 

Mill I I I I I I I I II I I I I I I I I I I I I II I I I I MINIM 

2515 GCCCCTCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCC 2 57 4 

3824 TCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCC 3883 

| | | || || I I II I I M I I I I M M II I I I I I I I I I I I I M I I I I I I M M II I I I I I I I M 
257 5 TCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCC 2634 

3884 GCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTG 3943 

| | | | | | || I I I M I II I I I II M I I II I I I I M I I I II I I II II M I 

2635 GCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTG 2694 

3944 CACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCG 4003 

| | | | | | || II I M M M I I M M I I I II I I I I I II M I I M I I M M I I I I I M II II I I 
2695 CACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCG 2754 

4004 GAG GAG GAT CAGT C GCT GGAGAAC AGT GAG G C C GAT GT GAAGGAGT C C AGGAAGGAT GT G 4 063 

I I II I I 1 I I I I M I I I I I I I I M M I II I 

2755 GGGG GG GAT CAGT C GCT G GAGAAC AGT GGG G C C GAT GT GAAGGAGT C CAG GAAGGAT GT G 2814 

4064 CTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGC 4123 

| | | | | | | | | | M I II II I I I I II I I I I I I I I I I I M I I I I M I I I I I IMM 

2815 CTCCCTGGGGCGGAGGGCCACGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGC 2874 

4124 TCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGT 4183 

| | || II II II II I II II II II I I II I II I I I M M I I I M I I I I M M I I I I M I II I 
2875 TCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCTG 2934 

4184 GGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAAC 4243 

I II I I M I II II I II II I II II I I I II II I II MM II II M I II II II I I I 

2935 GGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCCCCCCCTCTTTGATAAC 2994 

4244 CC ACAGGAC CCAGACAAT GT C AGC CT GCAAGAGGT GGAGGCAGAGGC C CT GT CGAGGGT C 4303 

M I I II II II II I II I I MMM M I II II II II II II II M I I 

2 995 C CAC AG GAC C C AGACAAT GT C AG C CT GCAAGAG GT GGAGGC AGAG GC C C T GT CGAGGGT C 3054 

4304 GGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTG 4 363 



1 1 1 1 1 1 1 1 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 

3055 GGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTG 3114 
4364 CTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTG 4423 

I I I I M M I I 1 t I I I I I I I I I M 1 t I I I M II I M I I I II M I I II I M I i I I I I M I I I 

3115 CTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTG 3174 

4424 CTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGT 4483 

| | I I I I I I I I I I I I I I I M I I M I I I I I I I I I I I I i I I M I 

3175 CTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGT 3234 

4484 GATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGC 4543 

| I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 

3235 GATCTTCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGC 32 94 

4544 AATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGAC 4 603 

| | M | M I I I II I I I I I I II I I II I I I I I I I I I I I I I I I M I 

32 95 AATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGAC 3354 

4604 GCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGC 4663 

I | llllll INI llllllllll II INN I! IMIIM I IIIIIMIMI 

3355 GCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGC 3414 

4664 GTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAG 4723 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

3415 GTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAG 3474 

472 4 TCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGG 47 83 

| | | | 1 I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

3475 TCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGG 3534 

4784 CTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCG 4 843 

MM I I I II I I I I I I I II II M I Mill 

3535 CTGCCACTGTCAAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCG 3594 

4 8 44 TCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAA 4903 

| | | | | M II II I I II I II I I II II II I I I I II M I I I I I I I I M I II I I M I I M I I I I 
3595 TCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCAAGAA 3654 

4904 ATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGC 4963 

I | | | M I II II I I II I I I I I I I I I I M II II I I I I I II I I II I II 

3655 ATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGC 3714 

4964 TCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATG 5023 

| M I II I I I I I I I M I I I M II I M I I I I M M I I I I II M II II I 

3715 TCTGCGCAGGGCACCGGCTTCTCCTGCCCCAACAGTGTGGGCGGGCACCCGCCCCAGATG 3774 

5024 C G G GT G GT C AC AG GC GAC AT C CT GAC C GAC AT C AC C GGC C AC AAT GT CT CT GAGT AC CT G 5083 

I | | I M I I I I I II I I M I I I I I I I I I I I I M I I I I I I I I M I M M I M I M I I M I M I 

3775 C G G GT G GT C ACAG GC GAC AT C CT GAC C GAC AT C ACC GG CCACAAT GT CT CT GAGT AC CT G 3834 

5084 CTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTC 5143 

| M | M I I M M II II II II I I II M II II II I I II I I I M I I II I II I II I I I I II II I 
3835 CTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTC 3894 

5144 CTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCG 5203 
| | || || | || M II II II II I I I M M II I II I i I M M I M II II I I I I I I M M M I 



3895 CTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCCGG 3954 
5204 GTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTAC 5263 

| | | | I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I ! I I I I I I M I I I I I I 

3955 TGCGCCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTAC 4014 
5264 CTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCG 5323 

I I I I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M M I I I I I I I I I I I I I I I 

4015 CTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCG 4074 

5324 GCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCC 5383 

| | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4075 GCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCC 4134 

5384 CTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATG 5443 

I I I I I I I I I I I I I I I I I I I I MINI I I I I I I I 

4135 CTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATG 4194 

5444 TCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAG 5503 

Ml | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 

4195 TCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAG 4254 

5504 CATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGG 5563 

| | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
4255 CACCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGG 4314 

5564 GACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGAC 5623 

| | | | | | M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I 
4315 GACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGAC 4374 

5624 CTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTAT 5683 

| | | M I I I I I I I I I I I I I I I I I I I I 

4375 CTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTAT 4434 

5684 GGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCC 5743 

| | M I I I I I I I I I I I I I I I I I M I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
4435 GGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCC 4494 

5744 GCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACC 5803 

| | : | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 

4495 GCCTACGKGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACC 4554 

5804 TTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAA 5863 

I I | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I II I I I I 

4555 TTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAA 4614 

5864 AGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTAC 5923 

| | | | | | | | | | | | I I I I M I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I 
4 615 AGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTAC 4674 

5924 AACGAGTACATCAACGAGTACTACGCCAAGATTGGCCAGTTTGACAAGATGAAGTCCCCG 5983 

| | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I 
4675 AACGAGTACATCAACGAGTACTACGCCAAGATTGGCCAGTTTGACAAGATGAAGTCCCCG 4734 

5984 TTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGC 6043 

| II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4735 TTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGC 4794 



6044 TTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTG 6103 

I | | | | | | | | | | | | | | | | II I M I I I I I I I I I I I M II I I I I I M M I I I I I I I I I I I M I 

TTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTG 



4795 
6104 
4855 
6164 
4915 



TCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGG 

I | | | | | | | | | | | | | | | | I I M I I I I I M I II I II M I I I I I I I M M I I I I I I I I I I I I 

TCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGGGTGCTCCGG 
G GAG AC G C C G AC AAT G AC AT G GT C AAG AT T GAGAAC C T GAC C AAGGT C T AC AAGT C C C G G 

i , I I I I | | | I I I I I I I I I I I I I I I I I I I M I I I I I I I I I M I I I I I I I I I I I M M II I I 

G G AGAC G C C GAC AAT GAC AT G GT C AAG AT T GAGAAC C T GAC C AAG GT C T AC AAGT C C C G G 



4854 
6163 
4914 
6223 
4974 



6224 AAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGC 6283 

| | | | | | | | | | || | | | | | I I II I I I I II I I I I I I I I I I I I I I I I I I I I II I M I 

AAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGC 



4975 
6284 



5034 
6343 



TTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGC 

Mllllhlll I I I I 1 1 1 I M I I I t I I M I t I I I I I I ! 1 I I I I I I I 

5035 TTCGGGCYCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGC 5094 



6344 GAC GAGAG C AC GAC GG GG GGC GAG GC CT T CGT CAAT G GAC AC AG C GT GCT GAAG GAGCT G 

HUH Mill I I I II I II I I II I I I I I I M I I I I I I M M 

5095 GACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTG 



6403 
5154 
6463 



6404 CTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTC 

|:|||| Mill II II I Mill 1 I I I I t I I I I I I 1 I I I I 1 I 

5155 CHCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTC 5214 

64 64 ACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAG 6523 

| | | | I I M M I M I M I I I I I I I M Mill II I I I I M hi I M I M I I II I I I 

5215 ACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTNCGTGGGATCYCCTGGAAGGACGAG 5274 



6524 GCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCG 

|| I II II I M M II I II II I I M II I II I M I I I I I I I I I 

5275 GCCCGGGT GGT GAAGT GG GCT CTGGAGAAGCTG GAGCT GACCAAGTACGCAGACAAGCCG 

6584 GCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGG 

I | || II II I II II II I I I II I I I I I M I I I I I I MINIM 

5335 GCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGG 



6644 
5395 
6704 



TACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGC 

M M II I M II I I II I M I I I I I I I I I 1 I I I I I I I 1 I I I I I I t I I I I I 

TACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGC 



TTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTGCTGACATCA 

M M II II M II II M II M II I I II II II II II II II II II II II II II M II M II I 

5455 TTCCTCTG GAAC CT CAT C CT T GAC C T CAT CAAGAC AGG G C GTT C AGT G GT G CT GAC AT C A 



6583 
5334 
6643 
5394 
6703 
5454 
6763 
5514 



6764 CACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGC 6823 

M I II II II II II II I I II M M I M II II II I I M II M II II I I II I I M I M M I M 

5515 CACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGC 



5574 
6883 



6824 CTGCGGTGCCTGGG C AGC AT C C AG CAC CT GAAGAAC C G GT T T G GAGAT G G CT AC AT GAT C 
| | M II II II II I II I II II II I I II II I II M I I I M I I II I II II II I I I I I M I I M 
5575 CTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATC 5634 



68 84 ACGGTGCGGACCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAAC 6943 

1 1 M 1 1 1 1 1 1 1 M 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 mm 1 1 1 1 1 1 1 1 1 1 

5635 ACGGT 



GCGGACCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAAC 5694 



6944 TTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCG 7003 



| | | | | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ICCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCG 

JCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGC 
Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml M M I I I I I III I I 



5755 GAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGC 5814 

7064 ATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAG 7123 
|| Mllll I I I II I I I I I 1 1 I I I I I I I I 1 MM 

5815 ATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAG 5874 
7124 AAGCAGAGTGACAACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCT 7183 

M M M I I II I I I M I II III I M I II I II M I I M I II II M I II I I I Ml II I 

5875 AAGCAGAGTGACAACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCT 5934 

7184 CTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTT 7243 

| | || Ml || | | | II II I I I M M I I I M II I II II I M II I I II I II M 

CTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTT 



5935 

7244 GTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAG 

| | | | | | || | | M II I II II I II I II I M II I I I I I M II I M I I II II M 

5995 GTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAG 



5994 
7303 
6054 



7304 GAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCA 7363 



6055 
7364 



| | || I II I I M I III I II I I M II I I I I Ml I II 

GAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCA 



GGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGA 

Mill M M I III I Ml M I I I M I I M I I II I I M I II I Ml M I M II I Ml 

6115 GGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGA 

7424 AGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCC 

I || III II M II I I II I I I M M M Ml I I II I I I M I H I N II Nil 

6175 AGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCC 



6114 
7423 
6174 
7483 
6234 



7484 TCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCC 7543 

I | M II I I II II I II II I I II II I II M II I M II I M M 

6235 TCCAGCCCCTGTACTCGGCCATG-CCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCC 6293 



7544 AAAGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGG 7603 

| | M I M M II I I I III II I I I M I II I III I M II M II III I II I 

6294 AAAGGCTGACCCGGCCTGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGG 



7604 GTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGG 

| | | | | | | M I II I I I II II I II II I M M M I III I II M I I M I I M I M I M 

6354 GTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGG 

7664 ACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGAT 

| || I I III II II I II I I Ml I I I M I III II III II I II II II I I I I I III I 

6414 ACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGAT 



6353 
7663 
6413 
7723 
6473 



7724 GAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGC 7783 



Db 


64 / 4 


1 1 1 1 I M | I I 1 I | | 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 

rAnrrr^rraTrrrrA^AnrGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGC 


6533 


Qy 


77 84 


TTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAG 
| | | | | | M | | 1 1 1 1 M 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 


7843 


Db 


6534 


6593 


Qy 


H O A A 

7844 


CCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGG 

| | | M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 Ml 

r-r-aTP arrTTrrrrrAnrTRGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGG 


7903 


Db 


r o A 

6b9 4 


6653 


Qy 


7904 


CAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCC 

| | | | | | M II 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 H 

rAAGGrRrCAGACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCC 


7963 


Db 




6713 


Qy 




CTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAA 

| | | | | | | | | | | M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 

CTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAA 


8023 


Db 


6714 


D / / J5 


Qy 


8024 


T AAAT AAACAAAAT GT C 8 04 0 




Db 


6774 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 
T AAAT AAAC AAAAT GT C 6790 





RESULT 8 
ABL53011 

ID ABL53011 standard; DNA; 8040 BP. 
XX 

AC ABL53011; 
XX 

DT 06-JUN-2002 (first entry) 
XX 

DE Rat ATP binding cassette transporter protein, ABCA2 , coding sequence. 
XX 

KW Rat; ABCA2 ; gene; neuroprotective; nootropic; antiparkinsonian; 
KW adenosine triphosphate binding cassette transporter protein; 
KW ATP binding cassette transporter protein; Alzheimer's disease; 
KW prion disease; Huntington's disease; Parkinson's disease; ds . 
XX 

OS Rattus sp. 
XX 

FH Key Location/Qualifiers 

FT CDS 67. .7372 

FT /*tag= a 

FT /product= "Rat ABCA2 " 

XX 

PN WO200208424-A1. 
XX 

PD 31-JAN-2002. 
XX 

PF 26-JUL-2001; 2001WO- JP006457 . 
XX 

PR 26-JUL-2000; 2000 JP-00225462 . 
XX 

PA (BANY ) BANYU PHARM CO LTD. 

PA (INAG/) INAGAKI N. 

XX 



PI Inagaki N; 
XX 

DR WPI; 2002-179907/23. 

DR P-PSDB; ABB76716. 
XX 

PT Adenosine triphosphate (ATP) binding cassette transporter gene ABCA2 of 

PT human or rat origin and encoded protein, useful for screening inhibitors, 

PT promoters and regulators of ABCA2 activity as drugs and diagnosis of 

PT ABCA2-related diseases. 
XX 

PS Claim 7; Page 82-87; 118pp; Japanese. 
XX 

CC The present sequence is the coding sequence for rat adenosine 

CC triphosphate (ATP) binding cassette transporter protein (ABCA2 ) . ABCA2 

CC can be used in the diagnosis, treatment and prevention of diseases such 

CC as Alzheimer's disease, prion diseases, Huntington's disease, and 

CC Parkinson's disease 



XX 
SQ 



Sequence 8040 BP; 1673 A; 2464 C; 2199 G; 1704 T; 0 U; 0 Other; 

Query Match 72.3%; Score 5810; DB 6; Length 8040; 

Best Local Similarity 84.0%; Pred. No. 0; 

Matches 6768; Conservative 0; Mismatches 1205; Indels 85; Gaps 15; 



Qy 



1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 

I | UN MINN Hill MINI Illllll Mil 

Db 34 CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 



60 
93 
120 



61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 

| | | I I I I I I I I I I I I I I I I I I I M II II II I lco 

Db 94 GCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGGAGCCCGTGGGTCCTGGCGTTTGAGAT 153 



121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 

MINIMI 1 I I I I I M I I I I I I II I I I I I I I II I 

Db 154 CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 



180 
213 
240 



Ov 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 

Y | | | | | | I I II I II I I I Ill I I I I I I I I I 

Db 214 CTCTGTGAAGGAAG— CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

Ov 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 

Y MM III II Mill Mill II II I MM Ml Illllll M 

Db 271 TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 

Ov 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 

I I I I I I I I I I I I I I I MM I M II Mill MM II Mill II I MM I 

Db 331 CAACTCCACGGTCACCCAGCTTCTGGAACGCCTCAACCGTGTAGTGGAAGAGAGCAACTT 

GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 

I | | M II II II I M M M II I 1 M I I II I M M I Mill 

GTTTGACCCAGAGCGACCTAGCCTGGGCTCAGAGCTTGAGGCACTGCACCAACGTCTGGA 



Qy 361 
Db 391 



Qv 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 

| || M II II I M I I I I I M M II M II M I I I I MM I I I I I I I I 

Db 451 GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 



300 
330 
360 
390 
420 
450 
480 
510 



Qy 481 CTTCT 



CTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 540 



I I Mil I III I Ml I Mill UN M Mill I Ml M Mill M 

511 CTTCTCTCTGGACTCGGTGGCCAGGGACAAAAGAGAGCTTTGGCGTTTCCTGATGCAGAA 570 
541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

| | M I M II 11 I I M II II I M II II II I I I II II M II II I 

571 CCTGTCACTGCCCAACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 
601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 



631 



MM I I I I I I II I M I II M MM M Mill 

GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 



690 



661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

| || | | || II II II II I I II M I I II I I M I II II I II M 

GAAGCAGGAGCCCTGGAGTCACCTGGGTAGCAATCCTCTGTTCCAAATGGAGGAGCTGCT 



691 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 

M I II I II I Ml M I N 

751 GCTGGCTCCTGCCCTTTTGGAGCAACTCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 



750 
780 
810 



7 81 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

Ml II M I II I M M I II M I M I M II I II II II II II II I II 

811 GATTCTTACCATGCCTGAGGGTCATCAGGTAGACCTTCAGGGCTACCGGGATGCTGTCTG 

8 4 1 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 

Mill II I I I I M M I II I M M M II II II 

8 7 1 CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 

|| | II II I II I M II II I I I I I II I I II II II I I Ml II 

931 CCAGCTGGACATAGCCAAGATTGCCCAGCAGCTGGGCTTCAATGTCCCCAACGGCTCAGA 

961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 

| M I II M I M II I II I I I I I M II I I I I I Ml I II I I M 

991 TCCACAGCCGCAGGCACCGTCCCCACAGAGTCTGCAGGCACTCTTAGGGGACCTGCTGGA 



870 
900 
930 
960 
990 
1020 
1050 



1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

M I I II I II II II I I I II II I M I I I M I II M Mill II II II II Mill M 

1051 TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 



1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 

M II M II II M II I I II II I I II I I I I I I I I I I I I 

1111 AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 

in mi nun i ii ii ii 1 1 i ii ii i ii ii ii ii ii i i ii 

1171 CAGCACCGGGGTAGGGGCAAATACAGGTCCCAACACCACCGTTGAGGAGGGCACCCAGTC 



1110 
1140 
1170 
1200 
1230 



1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

Ml I I I I I I I I I I II I I M II II II II II M M 

ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 



1231 
1261 



1290 
1320 



CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 

MUM II I M I I I I M I I I M M I I I I II M I I II I I I I I I I I I N II I' II 
1291 CTGGGCTGGCTTGCAGCCCATCTTGTGTGGCAACAACCGTACCATTGAGCCTGAAGCACT 1350 



1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 
Ml M II II M II I II M I I I I M I II II M I I I I II II M M II I II M M I 



Db 


1351 


r* r> r* n a r n r r n a a r a t r a. r r T P A P T PPPP T T T AC PAGC AAAGAACAACGGAAC CT GGGCCT 
CCGGAGGGGLAALA1 CjALLI L.r\Lx oou^x J. in^unu^nnn.uru-ivoi-ivu'oj-u-ww^ j. ^ 


1410 


Qy 


1381 


CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 
|| || 1 II II M II II 1 1 II II II 1 1 1 1 II 1 1 M 1 1 M M M M 1 1 1 1 1 1 1 1 1 

mr.mm n <v r r* a h r> t n a t r a r r a PP A AP P P P AA AAT CCT GT AT GCAC CC GCAGGCT CTGAAGC 


1440 


Db 


1411 


1470 


Qy 


1441 


CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 

| | M II 1 1 1 1 1 1 1 1 1 1 1 II M 1 1 1 Mill 1 II 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 
_ _ _ _ _ , rp -mm Tvm prirpr a a p p P A A ATP A P APPTTTGCCTTTGTGGGCAACGTGACGCACTA 


1500 


Db 


1471 


1530 


Qy 


1501 


TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 

M 1 I 1 1 1 1 1 1 1 1 1 1 1 N 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

r*nnnr*7Krrrvr*rvrrrrvr A AT ATPTPPPP APAPATPPPPAGCTTCCTGGAGCAGGGCAGGCT 


1560 


Db 


1531 


1590 


Qy 


1561 


GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 
Ml II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II II M 1 1 

(j C AG L AL LA 1 L i bLAL 1 bbL 1 bLAbL-Ho 1 n^u 1 Ou^/ 1 un^v x ^^uuv^ lnunvwi * " 


1620 


Db 


1591 


1650 


Qy 


1621 


ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 

| I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II Ml 1 1 1 1 1 1 1 1 M II 1 1 1 1 1 
^ rn^T\ t\ r- rrri r« a r-T r r a r 1 r a r r t r r r r r PT PPT PT PP PP P T GGACT ACT TTT CT CT GC C 

AATGAACC 1 G 1 LAL I bbALbAbL I bLLLLL x LL x ^ 1 U^ov^w x oun^inv/ i -- LJ -- L ^- L ^ jL 


1680 


Db 


1651 


1710 


Qy 


1681 


CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 
|| Mill 1 1 1 1 1 1 M II M Ml HI 1 1 1 1 1 1 1 1 

PAAmrrpArn rrrrTTrTrr app APPT APAP AP AAT AGAC AATGCAGCCTGTGGCTGGAT 


1740 


Db 


1711 


1770 


Qy 


1741 


CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 

| | 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II M 1 1 M M 1 1 1 1 1 
^mr T i/~7\rT»/~rp r *r.7\ 7\rr^vr apttttpap ATPTTP A APPPPTTTCCTGATGAGGAGAGCAT 

CCAGTTLAx G 1 LLAAbb 1 bAb Ibl LL/\L/\1 Oil ^rt/\oooox x x x ^jj-i± vjrLvjvj^\ji-L>->^ " 


1800 


Db 


1771 


1830 


Qy 


1801 


TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 

|| | | | M 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 II II M 1 1 1 1 1 1 1 1 Mill 
rx/-rp^7\ Ar m A r APTrTra atp APPPPTAPPAPPAPAATGTTACAGTATTTGCCAGCGTGAT 

CGI uAALl ALAL I L 1 LAnl LAbbLL u 1 in^/i'ain.i -l x ^ 


1860 


Db 


1831 


1890 


Qy 


1861 


CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 

|l, I I 1 1 1 II 1 II II 1 M II II II M M 1 M 1 1 1 II 1 1 1 

mrnm -_ Ar ,7\ nTl arr n r vrr r v r rrrr r vrrrrrc APATPTPPATTACAAGATTCGCCAGAA 

T T T C C AG AC AL L bAAb LA 1 bb 1 1 LLL 1 LLLL^w\^.ttx Ox <^<*f\± x rw^r^rx^jj-^ 1 x ou^^^u * 


1920 


Db 


1891 


1950 


Qy 


1921 


CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 

Ml M M II II II II 1 II 1 M M II II 1 1 1 1 1 

r-m^A nr*r>rnrn r -Hr*rr Ar a a a app A APP APATPPPTPPTGCTTACTGGCGTCCAGGGCCCAA 


1980 


Db 


1951 


2010 


Qy 


1981 


TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 

M II 1 II II 1 II II II II II II II 1 M II M II II 1 II 1 M M 

r* t\ n m r* rrn r r n r r fT t rT a ptt PPT P T A P PPPTT P PTPT PGAT CCAGGACAT GAT AGAACG 


2040 


Db 


2011 


2070 


Qy 


2041 


CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 

M II 1 II 1 1 II II II II 1 II 1 II II 1 II II II 1 II II II 1 1 II Mill 

rn c* r* c* 7\.*ri cik^f c* APAPPT |r T"T , P r PPPPPPA C^AC* C^^T 1 C^GT P P A AP P P GGCA^A.CTA.CGTGCA.GA.T 

TGCCA1 LAX LAALALbl 1 Ibi bbbbLAL/brt^u 1001 ^^J^Lt^^^^^J^^r^r^^ j. j-lv^vj x »■"-"■• 


2100 


Db 


2071 


2130 


Qy 


2101 


GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 

MMM 1 II I 1 11 1 1 1 I 1 M 11 11 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ■ ■■ 1 > ■ ■ 

GTTCCCGTACCCCTGCTACACCCGTGACGACTTCCTGTTTGTCATTGAGCACATGATGCC 


2160 


Db 


2131 


z iy u 


Qy 


2161 


GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 Mill 1 1 1 III 1 MM 1 1 1 MMMIIIIIMI 

ACTGTGCATGGTGATCTCCTGGGTTTACTCTGTGGCCATGACCATACAGCACATCGTGGC 


2220 


Db 


2191 


2250 



2221 GGAGAAGGAGC AC CGGCTCAAGGAGGT GAT GAAGACCAT GGGC CT GAACAAC GC GGTGC A 2280 

| | | | | | | | | | | I I I I I I I I ! I I I I II I I I II I I I I I I I I I I I I I Mill 

2251 G GAGAAAGAGC AT CGGC T AAAGGAGGT GAT GAAGAC GAT G GGC CT GAACAAC G C C GT G C A 2310 

2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

| | M | I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II 

2311 CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 237 0 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I I I I M I II I I I I I I II II I I I II I I I I I I I I I I I I I I I I I II I 

2371 C GC CAT C CT CAAGT AT G GC C AG GT C CT C AT G CAC AGC C AC GT GCT CAT CAT AT G GCT CT T 2430 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

Ml | | | | M | M I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
2431 CCTTGCTGTCTATGCTGTGGCCACTATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 90 

2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

24 91 TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 

2521 CAT GT AC GT GGCGAT CC GAGAGGAGGT GGCGCAT GAT AAGAT CAC GGCCTT CGAGAAGT G 2580 

| | | | M || II I I I I I Mill II II M II I I I I I II I I I I I I I I 

2551 CAT GT AT GTAGCAAT C C GT GAGGAAGT AGC C CAC GAT AAGAT CACT GCCTT CGAGAAGT G 2610 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 264 0 

Ml | M I I I I I I I II I I I I II I I I I I M I I I I I M M I I I I I I II Mill 
2611 CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 2670 

2 641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

Ml | | | | | || I I I II I I I I I I I I I I I I I I I I I I I I M M I I I I I Mill I I I I I 
2671 TGAAGTGGCAGGTGTGGGCATCCAGTGGCACACGTTCAGCCAGTCCCCAGTGGAAGGGGA 2730 

2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 

I | | | | | I II I I I I I I I II II I I I II I I I M M I I I I I M M I I I 11 II I 

2731 TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 27 90 

27 61 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 282 0 

| | | I I | | | | | I I I I I I II I I I I I I I I I I M I Mill I I I I I I I II I I II M I II I I 
2791 ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2850 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 88 0 

M I II II I I I I I I I I I I I I I I M I M I I I I I I I I I I M M II I I II M I I I I I I M 

2 851 CTTCCCACTACAGAAGTCCTATTGGCTGGGCAGTGGGCGGACAGAGACCTGGGAGTGGAG 2910 

2881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 94 0 

MIMI II I I II I I I M I I II II M II I I I I M I I II I I II I M II I I I I I I I 
2911 CTGGCCATGGGCACACGCACCACGCCTCAGCGTTATGGAGGAGGACCAGGCCTGTGCCAT 2 970 

2 941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I II II II II I I III II II I II I M M II I I I I I I I I M I M I I II Ill I 

2971 GGAGAGCCGGCACTTCGAGGAGACTCGCGGTATGGAGGAGGAGCCCACCCACCTGCCTTT 3 030 

3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

III I I I I I I I I I M I II II I I II I I I I II II II I I I M I I I M 

3031 GGT CGTCTGCGTGGACAAGCTC AC CAAGGTCT AT AAAAATGACAAGAAGCT GGCCTT AAA 3090 



3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

| M | | | I I I I I M I I I I I I I I I I I I I I I I I I I I I I I III I I I I M I I I I II M 
3091 CAAACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

| | M II I I I I I I I I II I I I I I I I I I I I M I I I I I I I I II I I I II I I I II II 
3151 TGGCAAGACCACTACCATGTCTATCCTGACTGGACTGTTCCCACCCACGTCGGGCTCAGC 3210 

3181 C AC CAT CT AC G G GCAC GAC AT C C G C AC G GAG AT G GAT GAGAT C C G CAAGAAC CT G G G CAT 324 0 

Ml | | | | | I I | M I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
3211 CACT AT CT AT G G C CAC GAC AT C CG CAC AGAGAT GGAT GAGAT C C GT AAGAACCT G GG CAT 3270 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

M I I I I I I I I I I I I I I II I II I I M I I I I I I I I I I I I I I I I I I I I I I I I I I 

3271 GTGCCCACAGCACAACGT GCTCTTT GACCAGCTCACT GTGGAGGAACACCT CT GGTT CTA 3330 

3301 CTCACGGCTCAAGAGCAT GGCT CAGGAGGAGATCCGCAGAGAGATGGACAAGATGATCGA 3360 

| | | | M I I M I I I I II II I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
3331 CT CAC GC CT CAAAAGCAT GGCACAAGAGGAGAT C C GCAAAGAGAT GGACAAGAT GAT CGA 3390 

3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I | | I I I I I I I I I I I I I I II II IMM M I I I I I I I I I I 

3391 GGACCTGGAGCTCTCCAACAAGCGCCACTCGCTGGTACAGACGCTGTCTGGAGGCATGAA 3450 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3480 

I | | | | | I I I II II Mill II II II I I I II I I II II I I M II III I M M 
3451 GCGCAAGCTTTCAGTAGCCATTGCCTTCGTGGGTGGCTCTAGAGCCATTATCTTAGATGA 3510 

3481 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

| | | I I I || || M M II II II II II M II II II II II M II I I II I II I II I I I 
3511 GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 3570 

3541 C AAG C C AG G C C G CAC CAT CCTTCTGTC CAC C CAC CAC AT G GAT GAG G C T GAC CTGCTTGG 3600 

| | I I I I || I I II I Mill I II II I I I I I I I Ml II II M I I M M II 

3571 CAAGCCGGGTCGCACTATCCTCCTGTCCACCCATCACATGGATGAGGCCGACCTGCTGGG 3630 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I | | | | | I I I I M I I I I I I I I I II I I I I I II M I I I I II I I I I M M I II I I I I I I I I 

3631 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3 690 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 372 0 

| M || | | I I I I I I I I II MM II IN M M Mill II 

3691 CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 8 0 

I | | | I II II II II II II II I II M I I II I I I II I I I I M I I II I I Ml 

3751 CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 
3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3 84 0 

| M Ml I II I I I II I II M II I I I II I I II I I II I I M II I I I I II II I M II 

3811 CTCAGAGATGCAAGTGTCCCAGTTCATCCGCAAGCATGTGGCTTCCTCCCTGCTGGTGTC 3870 
3 8 41 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I Mill II II II II II II II M I II II II I II I M I II M II II I II II 

3871 AGACACGAGCACCGAGCTCTCCTACATCCTGCCCAGCGAGGCTGTCAAGAAAGGGGCCTT 3 930 
3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 



3931 CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 

3 961 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4 020 

M I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I II II II I I I I I M 

3 991 GCTGATGGACACAACCCTGGAGGAGGTGTTCCTCAAGGTGTCTGAAGAAGACCAGTCACT 4050 

4021 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4 080 

| | II I I I I I I I II I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I 

4 051 G GAGAAT AGT GAG G C C GAT GT GAAGGAGT C C C G GAAGGAT GC ACT GCCTGGGG CAGAG GG 4110 

4 081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

|| | || Ml I M I I I I I I I I I I II II I I I I I I I I I I I 

4111 CCTGACGGCTGTGGAGAGTCAAGCAGGCAACCTGGCTCGGTGCTCAGAGCTGGCACAGTC 4170 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 420 0 

| I I I I I I II I I I I I I I I I I I I I I I I I I M I I I I I Mill 

4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 423 0 

42 01 C T AC AC C GAC GT CT AT GGC GACT AC CGCCCCCTCTTT GAT AAC C C AC AG G AC C C AGAC AA 42 60 

| | || I II I II I II I II I I I I I M I M I I I I I I II I Ml II II I I I I I I I I I 
4231 CT AC AC C GAC GGCT AC GGT GACT ACC GT CCCCTCTTT GACAACTT G C AGGAC C C AGAC AG 429 0 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

|| I M I I I II I I I I II I I I I M I M I I I I M 

4291 TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

Ml || I M I I I I I I MM I I I I I I II Mill II I I I II I M I I II I 

4351 GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4 44 0 

MM I I I I I I I I I I I I I I I I II M I I 

4411 CTGTGCTCGCCGGAACTCCAAAGCGCTCTGCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 4470 

44 41 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

| | | | | | M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II Mill 
4471 CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4530 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

| | M I II I II I I I I I II I M I I I M M M I I I I II 

4531 CCTGTCGCCTT CT CAGT AC CACAACT AT AC C CAGC C C C GT GGCAACT T TAT C CC C TAT GC 459 0 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

II I I II I I II II I I I Mill M M M I I I I I I I I I I I I I I I I 

4591 C AAT GAG GAAC GC C GC GAGT ACC GAT T AC GGCT GT C AC CT GAT G C C AG C C CC CAGC AGT T 4 650 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 680 

M I M M II M II I I II M I I I I MUM M M 

4651 GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

M I I II II I II II I I I II I I Mill I M M M M I I I I I I I II I I II I II M 
4711 CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 4770 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 80 0 
II M II I I II I I I I Mill I II I I I II I M I M M M I I M I I I I M M I I I I I N 



47 71 AC GGTTCTTC GAC AGT AT GT GC CT GGAGT C CT T CAC AC AG G G GCT GC C AC T GT C CAAC T T 4 830 

4 801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA-— 4857 

| M | || | | | | I M I I I I I I II II I I I I II I I I M M I I I I I I I I I I I I I I I 
4831 CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 4 8 90 

4858 CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4 917 

| | | | | | | I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

4891 ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4 950 

4918 ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4977 

|| || | M I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 951 GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

4 978 CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 

M I I II I I I I I I I I I I I I I I I II II 

5011 GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 5070 

5038 C GACAT C CT GAC C GAC AT CAC C GG C C AC AAT GT CT CT G AGT AC CT G C T CT T CAC C T C C GA 50 97 

I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

5071 G GACAT C CT GACT GACAT CAC C GG CC ACAAT GTT T C C GAGT AC CT GC T CT T C AC CT CT GA 5130 

5098 CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTG7VAGTCCATCCC 5157 

Ml | | I I I I I I I I I I I I I I II I I I I I II I I I I I I I I M Ml I I I I I I I I I I I I 
5131 CCGTTTCC GAC T G CAC C G C TAT G GAG C CAT CAC C T T T G GT AAT AT C C AGAAGT C CAT C C C 5190 

5158 AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

| | | | || | | I I I I I I i I I M II I I I I I I I I I I I I I M 

5191 AGCACCCATTGGTACCCGGACCCCTCTCATGGTCCGGAAGATTGCAGTGCGGAGGGTGGC 52 50 

5218 C C AGGT T T T CT ACAACAACAAGG G CT AT CACAGCAT GC C CAC CT ACCT CAAC AGC CT CAA 527 7 

MINI III I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I M I I 

5251 C C AGGT G CT CT AC AACAACAAGG G CT AC CAC AG CAT GC C CAC CT ACCT CAAC AG C CT CAA 5310 

527 8 CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

IN | | | | I I I I I I I I I I I I I I I I I I I I II II I I I I I H 

5311 CAATGCCATTCTGCGTGCAAACCTACCCAAAAGCAAGGGCAATCCAGCAGCCTACGGTAT 537 0 

5338 CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC CAGC GCC AGC CT CT C CC T GGAT T AC CT GCT 5397 

M | I I I I MINIM! II I I I I I I I I I I II I I I I I I I I II 

5371 CAC C GT CAC CAAC CAC C C CAT GAACAAGAC C AGT GCT AGC CTCTCCCT GGAT T AC CT ACT 5430 

5398 GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

|| I I II I I I II M I I I I I I I I I I I I IN I I I M I I I I I I I I I M I I I I I I I 

5431 GC AGGGC ACAGAC GT GGT C AT CG C CAT C T T CAT CAT T GT G GC C AT GTCCTTCGTGCCGGC 5490 

5458 CAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGT 5517 

| | | M I I I I I I I M I I I I I I I I I I I I I I I I I M II II I I I I I I 

5491 CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 

5518 CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 5577 

I | || M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

5551 CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 

5578 CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 5637 

I || II I I II II I I II I I II II I I I M I I I I I Ml I M I I I I I I I I I I 

5611 CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 5670 



563 8 GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

| | | | M I I I I I I I I I I I M M I I I I I I I I I I I I I I I M I I I I I II I I I I I I I I 
5671 GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 5730 

5698 GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 5757 

I I I I I I I I I I II I I I I I II M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5731 ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 57 90 
5758 CAT T GT CAT C AAT CT CT T CAT C GGCAT CACC GC CAC C GT GGC C AC CTT C CT GCT ACAGCT 5817 

Ml I I | I I I I I I I I I I I I I MINIM INN I I I M I II M It II II I I I I I 

57 91 CATCGTCATCAACCTCTTCATTGGCATCACGGCCACAGTGGCCACCTTCCTTCTGCAGCT 5850 

5 818 C T T C GAG CAC G AC AAG G AC C T G AAG GT T G T C AAC AGT T AC C T G AAAAG CTGCTTCCT CAT 5877 

IN I I I I I I I M I M I I II I I I I I I I I M M I M I I II I I I I I N I 'I I I I II I I H 
5851 CTTTGAGCATGACAAGGATCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCAT 5910 

5878 TTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAA 5937 

| M I M I I I M I I I I II I I I I I I I M M I I I M I I I I I I I I I I I I I I I I I I I I I I I 
5911 C T T C C C C AAC T AC AAC C T G G G C CAC G G AC T CAT G GAG AT AG C C T AC AAC GAAT AC AT C AA 597 0 

5938 CGAGTACTACGCCAAGATT GGCCAGTTT GACAAGAT GAAGT CCCCGTTCGAGT GGGACAT 5997 

| | I Mill I II I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I M I I I I I M I M I 
5971 C GAAT ACT AT G C CAAGAT C GGC CAGT T T GACAAGAT GAAGT C C C C GT T T G AGT GG GAC AT 6030 

5998 TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 6057 

MINI II I I I I I I I I I M M I I I Ml H 11 1 11 11111 

6031 TGTCACACGTGGACTGGTGGCCATGACAGTCGAGGGCTTCGTGGGATTCTTTCTCACCAT 6090 

6058 CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 6117 

| || M I II II I I I I I I M I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I 
6091 CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTAAACCTGT 6150 

6118 GGAGGAT GAT GT GGAC GT G GC CAGT GAG C G G CAGC GAGT GCT C C GGG GAGAC GC C GACAA 6177 

| | | || | | | I I I I II I II I I II M I II I I II II I II II I I I II II II 

6151 G GAAGAC GAT GT AGAC GT G GC CAGT GAG C GG C AAAGAGT GCT C CGT GGC G AT GCT GACAA 6210 

6178 T GAC AT G GT CAAGAT T GAG AAC CT GAC C AAG GT CT AC AAGT C C C G G AAGAT T GG C C GT AT 6237 

| | M I I I I I I I I I I I I Mill I I I I I I I I I I Mill II 

6211 T GACAT GGT CAAGAT CGAGAACCT GACT AAGGT GTACAAGT CT CGGAAGAT CGGCCGCAT 627 0 

6238 CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 6297 

I | M M II I I I II I M I I I I I I I M II I II II M I I I II I I I II I I II II M 

6271 CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 6330 
6298 CGT C AAC GGTGCGGG C AAG AC C AG CAC CTT CAAGAT GCT GAC C G G C GAC GAG AG CAC GAC 6357 

M II I II I II II I M I I I I I I I I M I I I I I I II MM M II I I I II II I M 

6331 G GT CAAT GGT G C C G GGAAGAC C AG CACC TT CAAGAT GT T GACT GGAGAT GAGAGC AC AAC 6390 

6358 GGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCA 6417 

I | M II II II I II II I M II I II I I I M II II II I II II M II I 

6391 AGGGGGCGAGGCCTTTGTCAATGGACACAGTGTGCTCAAGGACCTGCTCCAGGTTCAGCA 6450 

6418 GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 6477 

M II I I II II II II II Mill M I I I II I II I I M M M 

6451 GAGCCTTGGCTACTGCCCACAGTTCGACGCCCTGTTCGATGAGCTCACGGCTCGCGAACA 6510 



647 8 CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 6537 

| | I I I I M M I I II I I I I I I I I I I I I I I I I I I I I I I I 

6511 CCTGCAGCTGTATACTCGGCTTCGAGGCATCCCCTGGAAGGATGAGGCGCAGGTGGTGAG 6570 

6538 GTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAG 6597 

I I I I I I I I I I I I I I I I I I I M I I I I 

6571 GTGGGCCCTGGAGAAGCTGGAGCTGACGAAGTGTGCAGACAAGCCAGCCGGTAGCTACAG 6630 

6598 CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 6657 

|| || I I I I I II I I I M I II I I I I I I I M I 

6631 TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 6690 

6658 CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 6717 

IN || I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I 
6691 CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 6750 

6718 CAT C C T C G AC C T CAT C AAG AC AG G G C G T T C AGT G GT G C T G AC AT C AC AC AG CAT G GAG G A 6777 

| | | || I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II 
6751 CAT T CT GGAC CT CAT CAAGAC AGGAC GT T C AGT GGT GCT GAC CT C AC AC AG CAT GGAGGA 6810 

677 8 GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 6837 

I | II I I I I I I I I I I I I I M I I M M I MM 

6811 ATGCGAGGCTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 6870 

6838 C AG CAT C C AG C AC C T G AAG AAC C G G T T T G GAG AT G G C T AC AT GAT C AC G G T G C G GAC C AA 6897 

|| | II I I I II I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I M I II I I I I 
6871 GAGTATCCAGCACCTCAAGAACAGGTTTGGGGACGGCTACATGATCACTGTAAGGACCAA 6930 

6898 GAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCAT 6957 

| | | I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II I I M I 
6931 AAGCAGCCAGAACGTGAAGGATGTGGTGCGGTTCTTCAACCGGAACTTCCCAGAGGCCAT 6990 

6958 GCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCT 7017 

| | | | | I I I I M I I I I I II I I I I I I I II II I I II I I I I I I I I M I I I 1 I I I I I I M 
6991 GCT CAAGGAAC GCC AC CAT AC GAAG GT G C AGT AT CAG CT CAAGT CGGAG C AC AT CT C G CT 7050 

7018 GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 7 077 

Ml M I I I I I I M III M II I 

7051 GGCTCAGGTGTTCAGCAAGATGGAGCACGTGGTCGGTGTACTGGGCATCGAGGACTACTC 7110 

7078 GGT CAGC C AGAC CACACT GGACAAT GT GTT CGT GAACTTT GC CAAGAAGCAGAGT GACAA 7137 
I I I I I I I I I I I I II I I I I I II Mill I I I I I II I I I I I I I I II I I I I I I I I I I 

7111 AGT CAGC C AGAC CACT CT G GAT AAC GT GTT T GT GAACTT C G C CAAGAAG CAAAGT GACAA 717 0 

7138 CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 7197 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I Ml 
7171 TGTGGAGCAGCAAGAGGCTGA GCCATCCACCTTGCCGTCCCCCCTTG GACTACT 7224 

7198 CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 7257 

M I I I I II I I I I I I I I MM II II I I M I I II I I II I I I II M I M Mill 

7225 TAGCCTGCTGCGGCCCCGCCCTGCACCCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 7284 

7258 C GAG GAC C T GGAC AC G GAG GAC GAG G GC C T CAT C AG CT T C GAG GAG GAG C GG GC C CAG CT 7 317 

I || I II II I I I I I II I I II II II II I I II II II I II I I II I II I II II II II II M II 
72 85 T GAG GAC CT G G AC ACGGAG GAC GAG G GC CT CAT CAG CTT CGAG GAAGAG C GG GC C CAG C T 734 4 

7318 GTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTC 737 7 



Db 


7345 


| I I I 1 II 1 1 1 1 1 I 1 1 M II 1 1 II 1 1 1 1 1 1 1 1 

CTCCTTCAACACCGATACGCTCTGCTGACGTTCAAGAGTCACATCAGGGAI G 


/ O ZJ VJ 


Qy 


7378 


CACTGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCC 
III II II 1 1 1 1 1 1 M 1 

rl/ -<mj^mrnminin/i / ->^i7i /i7\ 71 /^mri 7\ ^ d ^ 7\ d d (~* T\ ^T* C* 7\ f~* ^ A 


7437 


Db 


7397 


74 4 S 


Qy 


7438 


TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 

1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 

TGCCAGGCCCTGGAAAGGCAGGTTCAGGACCAAAGGGCTCCCGCCCTCC 


74 Qfi 


Db 


7446 


7 4 Q 4 

/ fi 27 *i 


Qy 


7497 


CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCG 

Ml 1 1 Ml 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 


7556 


Db 


7495 


7 s ^ 


Qy 

Db 


7557 
7537 


GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 

| M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 III III II 1 

GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGICLIGGCCLA^U 


7 £ 1 R 
7 ^ Q £ 


Qy 


7616 


CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 

|| 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mill 1 1 1 1 1 1 
CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 


7 £7 "3 


Db 


7597 


/ DjD 


Qy 


7674 


GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 

III 1 1 1 1 II 1 III 1 M M 1 

TGTGACCCTTCTCTGCAGCGGCCACCAGTCTACCCAGGCCAGCATCTTGCACAGAI GI CI 


/ / O O 


Db 


7657 


7 7 1 £ 

/ / J. O 


Qy 


7734 


GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 

| || I 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTCATGAAAAGACTGCAGTTGGGGAGGTGGCAGCTTGCCTACTTATTTTGCTTTAAGA 


77 Q9 


Db 


7717 


77 7 4 


Qy 


7793 


AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 

1 1 1 1 III II M 1 1 1 1 IN 1 1 1 1 1 M 1 1 1 1 
GCCTCCCT CACT CT GCTGTT GT GAAGAAGT T AGGCT AC CAT GGGAAGC CAT GAAT G 


TOCO 


Db 


7775 


7 ft "3 n 

/ O .3 U 


Qy 


7853 


TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 

Ml II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 

TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGClAOblG 


/ y u d 


Db 


7831 


7 ft q n 


Qy 


7906 


AGGGGCCA GACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 

1 1 1 1 1 1 1 1 1 1 1 1 1 M 

AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 


7 Q £D 


Db 


7891 


7949 


Qy 


7961 


CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 

I I I I I I I I 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 

-CCCTTCCTGC CAC C CAT GT GGGAGT AG GAC CT T GT AT AT AGC ACACAGAT GT T T GT T TT 


8020 


Db 


7950 


8008 



Qy 8021 AAAT AAATAAAC AAAAT G 8038 

I II I I I I I I I I I I I I 
Db 8 0 09 CAATAAATAAGCAAAAAG 8026 
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PT 


Predicting at least one toxic effect of a compound, useful for toxicity 


PT 


modeling, comprises preparing a gene expression profile of a tissue or 


PT 


cell sample 


exposed to the compound, and comparing the gene expression 


PT 


profile to a 


database . 


XX 






PS 


Example 4; Page; 446pp; English. 


XX 






cc 


The invention relates to a novel method of predicting at least one toxic 


cc 


effect of a 


compound. The method comprises a gene expression profile of 


cc 


tissue or cell sample exposed to the compound, and comparing the gene 


cc 


expression p 


rofile to a database comprising at least part of the data or 


cc 


information 


given in the specification. The methods are useful for 



CC predicting at least one toxic effect of a compound, predicting the 

CC progression of a toxic effect of a compound, predicting the renal 

CC toxicity of a compound, or identifying toxicity markers in tissues or 

CC cells exposed to known renal toxin. The genes are useful as toxicity 

CC markers in drug screening and toxicity assays, in monitoring disease or 

CC physiological states, or disease progression. This polynucleotide 

CC represents a rat DNA sequence relating to the toxic effect database 

CC described in the specification. NOTE: The sequence data for this patent 

CC did not form part of the printed specification, but was obtained in 

CC electronic format directly from the World Intellectual Property 

CC Organization 

XX 

SQ Sequence 8040 BP; 1673 A; 2464 C; 2199 G; 1704 T; 0 U; 0 Other; 

Query Match 72.3%; Score 5810; DB 7; Length 8040; 

Best Local Similarity 84.0%; Pred. No. 0; 

Matches 6768; Conservative 0; Mismatches 1205; Indels 85; Gaps 15; 
Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I 1 1 I II I I I I I I I I I I I MM M M M I M M M M M M M M M M I I 

D b 34 CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 93 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

M M M M M M M M M M M M I I M M M M M M M MM I I I I I I I 

Db 94 GCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGGAGCCCGTGGGTCCTGGCGTTTGAGAT 153 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

M M M M M i MM I I Mill MM I I I I II II 

Db 154 CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 213 

Q y 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

Ml II II II I I M I I I M M II I I II I II I I I I M II I II I II 

Db 214 CTCTGTGAAGGAAG CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

M I II I M I II I I I I M II M II II I II I I I I I I I I I M I M 

Db 271 TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 330 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

M II II I I I M I M I I I II I II M I I I I I M M I I I I I II I I I 

Db 331 CAACTCCACGGTCACCCAGCTTCTGGAACGCCTCAACCGTGTAGTGGAAGAGAGCAACTT 390 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

Ml II M I I I I I I I I M I I I I I I I MUM 

Db 391 GTTTGACCCAGAGCGACCTAGCCTGGGCTCAGAGCTTGAGGCACTGCACCAACGTCTGGA 450 

Q y 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 480 

M I I II I II I II I I I I II II II I I I I I I I I M I II I I I I II I I M 
Db 451 GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 510 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

M II M I I II II II II Ill II I M M I I M I II II I I II II I II 

Db 511 CTTCTCTCTGGACTCGGTGGCCAGGGACAAAAGAGAGCTTTGGCGTTTCCTGATGCAGAA 570 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I II I I I M II II I II M II I II I I II Ml MM I II I I II I I I I II I M 

Db 571 CCTGTCACTGCCCAACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 



601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

| | | | I I I I I I I I M M II I I I I I I I I I I M I I I Ml II I I I I I 
631 GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 690 

661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

| | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

691 GAAGCAGGAGCCCTGGAGTCACCTGGGTAGCAATCCTCTGTTCCAAATGGAGGAGCTGCT 750 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 78 0 

| | I | | M I I I I I I I I I I I I I I I I I I I I II I M I I I II I I I I I I I I I I I I II 
751 GCTGGCTCCTGCCCTTTTGGAGCAACTCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 810 

7 81 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 8 4 0 

Ml || || I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
811 GATTCTTACCATGCCTGAGGGTCATCAGGTAGACCTTCAGGGCTACCGGGATGCTGTCTG 8 70 

841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I I I I I I I M Ml M I I II I 

8 71 CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 930 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 9 60 

| I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M 
931 C CAG C T G G AC AT AGC CAAGAT T GC C C AG C AGC T GGG CT T CAAT GT C C C CAAC G G CT C AGA 990 

961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

| | | I I I I I I II I M I I I I I I i I I I I I I I I I I I I I I I I I II I I I I I 
991 TCCACAGCCGCAGGCACCGTCCCCACAGAGTCTGCAGGCACTCTTAGGGGACCTGCTGGA 1050 

1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

M I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I M 
1051 TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 1110 

1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

I I I I M I lit I I I I I I til I III 1 I M I I I I I. 

1111 AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 117 0 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

| | | | I I I I I I I M I I I I I I I I I I I I I I I I I II I I I II I I I I I M 
1171 CAGC AC C G G G GT AGG GG CAAAT AC AGGT C C CAAC ACCAC C GT T GAGGAG GG CAC C CAGT C 1230 

1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

Ml || | | | | I I I II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 
1231 ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 1290 

1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

I I I I II Ml I I I I I I I I I II I I II I II I I I I I I I I I I I I I I I I II II II II II 

1291 CT GGGCT GGCTTGCAGCCCAT CTT GT GT GGCAACAACCGTACCATTGAGCCTGAAGCACT 1350 

1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

Ml | | | | || | M I I I I I II I II II I I I I II I I I I I II II I I I I I I M I I I II I 
1351 CCGGAGGGGCAACATGAGCTCACTGGGCTTTACGAGCAAAGAACAACGGAACCTGGGCCT 1410 

1381 CCTCGTGCACCT CAT GACCAGCAACCCCAAAATCCTGTACGCGCCTGC GGGCT CTGAGGT 144 0 

II I I I I I I I I I I I I I I II I I I I I I I I II I I M I I II I I I I I 

1411 TCTTGTGCACCTCATGACCAGCAACCCCAAAATCCTGTATGCACCCGCAGGCTCTGAAGC 1470 



Qy 


1441 


CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 

I I I I M I 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 INN 

TGACCATGTTATCCTCAAGGCAAATGAGACCTTTGCCTTTGTGGGCAACGTGACbUA^lA 


1500 


Db 


1471 


1 ^ *3 n 


Qy 

Db 


1501 
1531 


TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 

1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 II 1 1 II 1 1 1 1 1 MINI 

CGCCCAGGTCTGGCTCAACATCTCCGCAGAGATCCGGAGCTTCCTGGAGCAGGGCAGGCi 


1 R^n 

1 JOU 

1 CQfl 


Qy 


1561 


GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 

I I I I 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M II II 1 II 1 1 1 1 1 1 1 M M 
GCAGCAGCATCTGCACTGGCTGCAGCAGTACGTGGCTGACCTCCGGCTACACCCTGAAGu 


1 £9 n 

± DZ U 


Db 


1591 


loou 


Qy 


1621 


ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 

1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M Ml 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 
AATGAACCTGTCACTGGACGAGCTGCCCCCTGCTCTGCGCCTGGACTACTTTTCTCTGCC 


1 DO U 


Db 


1651 


1 / ± u 


Qy 


1681 


CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 

II 1 1 1 1 1 Mill II II II 1 II 1 1 II II II II II 1 II 1 II II M 1 1 II 1 1 
CAAT G G C AC AGC CCT T CT G CAGC AGCT AGAC ACAAT AGAC AAT GC AG CCTGTGGCTG GAT 




Db 


1711 


1 H *7 C\ 
1 / / U 


Qy 


1741 


C CAGT T CAT GT C CAAG GT GAG C GT GGAC AT C TT CAAGGGCTT C C C CGAC GAG GAGAGC AT 
1 I I M I II II II 1 II 1 1 II 1 1 1 II 1 II II 1 II 1 1 M 1 1 M II II II II 1 1 1 II 1 1 
C CAGT T CAT GT C CAAGGT GAGT GT GGAC AT CTT CAAG GGGTTTCCT GAT GAGGAGAG CAT 


1 onn 
loUU 


Db 


1771 


1 0 0 u 


Qy 


1801 


T GT CAACT AC AC CCT CAAC C AGGC CT AC C AG GACAAC GT CACT GT TT T T GCC AGT GT GAT 

II 1 1 1 1 1 II 1 1 II II 1 1 1 1 II 1 1 1 II 1 II 1 M II II II II II 1 II 1 1 1 1 1 1 

CGT GAAC T ACACT C T CAAT CAG G C CT AC CAGGACAAT GTT AC AGT AT T T G C CAGC GT GAT 


1 0 C Pi 


Db 


1831 


1 q q n 

1 0 y u 


Qy 


1861 


CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 

1 1 1 1 II II II 1 1 II II II II 1 II II II II M M 1 1 1 M II 1 II II 1 1 II 
TT T C C AGACAC GGAAG GAT GGT TCCCTCCCCC C AC AT GT C CAT T ACAAGATT C GC CAGAA 


1 o 0 n 


Db 


1891 


1 you 


Qy 


1921 


CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 

III 1 1 II 1 II II II 1 II II M 1 II 1 II 1 M II II II 1 1 1 II 1 II II 1 1 II II II 
CT CAAG C T T CAC C GAGAAAAC CAAC GAGAT C C GT C GT GCT TACT GGC GT C CAGGGC C CAA 


1 QQ A 

1 y 0 u 


Db 


1951 




Qy 


1981 


TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 

1 1 II 1 1 1 II II II 1 1 II 1 II 1 M II 1 1 1 M 1 II M 1 1 M II II 1 1 

CACTGGTGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATAGAACG 


Z U 4 U 


Db 


2011 


z u / u 


Qy 


2041 


CGCCATCAT CGACACTTTT GT GGGGCACGACGT GGTGGAGCCAGGCAGCTACGTGCAGAT 

I I II 1 II II II II 1 1 II II 1 II 1 II 1 M 1 II 1 1 M M 1 1 II 1 II II 1 II II II 

T GCC AT C AT CAAC AC GT T T GT G G GG C AC GAC GT GGT C GAAC C C GGCAAC T AC GT GCAbA 1 


zlUU 


Db 


2071 


01 on 
Z 1j U 


Qy 


2101 


GT T C C C C T AC C C CT GCT AC ACAC G C GAT GACTT C CT GT TT GT CAT T GAGC AC AT GAT GCC 

1 M II 1 II II II 1 II II 1 M II II II II II 1 1 M M 1 1 II 1 1 II 1 II II II 1 II II 

GTTCCCGTACCCCTGCTACACCCGTGACGACTTCCTGTTTGTCATTGAGCACATGATGCC 


2160 


Db 


2131 


01 an 
z 1 y u 


Qy 

Db 


2161 
2191 


G CT GT G CAT G GT GAT CT CCT G GGT CT AC T C C GT GGC CAT GAC CAT CCAGC AC AT C GT GG C 
1 1 1 1 M II II II II 1 II 1 1 II 1 1 1 1 1 II 1 II 1 1 II II 1 1 1 1 1 II M II II II M II 

ACT GT G CAT GGT GAT CT CCTGGGTT T AC T CT GT GG C CAT GAC CAT AC AG CAC AT C GT GGC 


0 0 0 n 
ZZZ U 

0 0 ^ Pi 
ZZ D U 


Qy 


2221 


GGAGAAGGAGCACCGGCT CAAGGAGGT GAT GAAGACCATGGGCCT GAACAACGCGGTGCA 

MUM Mill II 1 II 1 II II II II 1 1 II II 1 1 1 II 1 II II 1 II M M II M 1 1 1 

GGAGAAAGAGCAT C GGCTAAAGGAGGTGAT GAAGAC GATGGGCCT GAACAACGCCGT GCA 


2280 


Db 


2251 


2310 


Qy 


2281 


CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 


2340 



Db 


2311 


Qy 


2341 


Db 


2371 


Qy 


2401 


Db 


2431 


Qy 


2461 


Db 


2491 


Qy 


2521 


Db 


2551 


Qy 


2581 


Db 


2611 


Qy 


2641 


Db 


2671 


Qy 


2701 


Db 


2731 


Qy 


2761 


Db 


2791 


Qy 


2821 


Db 


2851 


Qy 


2881 


Db 


2911 


Qy 


2941 


Db 


2971 


Qy 


3001 


Db 


3031 


Qy 


3061 


Db 


3091 


Qy 


3121 



Mill I I I I I I I I I I I I I I II M I I I I I I I I I I I I M 

CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 237 0 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 24 00 

I II I I I I I 1 M M MINI I I I I I I I I I 

CGCCATCCTCAAGTATGGCCAGGTCCTCATGCACAGCCACGTGCTCATCATATGGCTCTT 2430 

CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

Ml II I I I M II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
CCTTGCTGTCTATGCTGTGGCCACTATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 90 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I M 

TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 

CAT GT ACGT GGCGAT CCGAGAGGAGGT GGC GCAT GATAAGAT CACGGCCTT CGAGAAGT G 25 80 

I I I 1 I I II II I I I I I I I I I I M M M M I 

CAT GT AT GT AG C AAT C C GT GAGGAAGT AGC C CAC GATAAGAT CACT GC CT T C GAGAAGT G 2610 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 64 0 

I M I I I I I I I I I I I I 1 I I I II I I I I I M I I M I M M I 

CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 2670 

TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 27 00 

| | I | I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAAGTGGCAGGTGTGGGCATCCAGTGGCACACGTTCAGCCAGTCCCCAGTGGAAGGGGA 2730 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 
TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 27 90 

CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 282 0 

I I II I II I I I I I I I I I I I II I I I I Ml I Ml 

ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2850 

CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 80 

| M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I I 
CTTCCCACTACAGAAGTCCTATTGGCTGGGCAGTGGGCGGACAGAGACCTGGGAGTGGAG 2910 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2940 

| | I I I I I I I II I I I I M MINIM II I I I I I I I II I II II I II II I I I M I I 
CTGGCCATGGGCACACGCACCACGCCTCAGCGTTATGGAGGAGGACCAGGCCTGTGCCAT 297 0 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

|| I || || || I I III I I M I I I I II II I I I I I II I II M I I I I I II I M I 

GGAGAGCCGGCACTTCGAGGAGACTCGCGGTATGGAGGAGGAGCCCACCCACCTGCCTTT 3030 

GGTTGTCTGCGTG GAC AAAC T CAC CAAG GT CT AC AAGG AC GAC AAGAAG CTGGCCCT GAA 30 60 

II I I II II I II I I I I I I I II II I I II II M I II I I I I I I II I I M II M I M 
GGTCGTCTGCGTGGACAAGCTCACCAAGGTCTATAAAAATGACAAGAAGCTGGCCTTAAA 3090 

CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

I M I I II I I II II M I I M II II M M I I II I I M I IN I I I I I I I I M II II 
C^AACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 

GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I M II I I I II I I I I I I I I II II I I I I II I I II II I I M MINIM M II 



Db 


3151 


Qy 


3181 


Db 


3211 


Qy 


3241 


Db 


3271 


Qy 


3301 


Db 


3331 


Qy 


3361 


Db 


3391 


Qy 


3421 


Db 


3451 


Qy 


3481 


Db 


3511 


Qy 


3541 


Db 


3571 


Qy 


3601 


Db 


3631 


Qy 


3661 


Db 


3691 


Qy 


3721 


Db 


3751 


Qy 


3781 


Db 


3811 


Qy 


3841 


Db 


3871 


Qy 


3901 


Db 


3931 


Qy 


3961 


Db 


3991 



TGGCAAGACCACTACCATGTCTATCCTGACTGGACTGTTCCCACCCACGTCGGGCTCAGC 3210 

C AC CAT CT AC G G GC AC GAC AT C C G C AC GGAGAT GGAT GAG AT C C G CAAGAAC CT G G G CAT 3240 

Ml | | | | | M I I I I I II II M I I I I I I I I I I I I I M I I I I I I I I I I I I I M I M I 
CACTAT CT AT GGC CACGACAT CCGCACAGAGAT GGAT GAGAT C CGTAAGAACCT GGGC AT 327 0 

GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

M I I I I II I I I I I I I I II I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GTGCCCACAGCACAACGTGCTCTTTGACCAGCTCACTGTGGAGGAACACCTCTGGTTCTA 3330 

CT C AC G GC T CAAGAG CAT G G CT C AGGAG GAGAT C C G C AGAGAGAT G GAC AAGAT GAT C GA 3360 

MINI Mill I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

CT C AC G C CT C AAAAGCAT GGC ACAAG AGGAGAT C C G C AAAGAG AT G GAC AAGAT GAT C GA 3390 

GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I I M II I I I I I Ml MMI I I I II I I I I I I I I 

GGAC CT G GAG CT CT C C AACAAG C G C C ACT C G C T G GT AC AGAC GCT GT C T G GAG GC AT GAA 3450 

GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 8 0 

| | | I I I I M II II I I I I I I I I I I I I II I I I I I I I I I I I I I I Ml I II II 
GCGCAAGCTTTCAGTAGCCATTGCCTTCGTGGGTGGCTCTAGAGCCATTATCTTAGATGA 3510 

GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 354 0 

| | I I I I || I I I I II I I I I I I I I M II II I I I I I I I I I I I I I I I I I II I I I I I I 
GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 3570 

CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

MINI II I I I I MINIMI I I t I I I 1 I MM Ml I I 

CAAGCCGGGTCGCACTATCCTCCTGTCCACCCATCACATGGATGAGGCCGACCTGCTGGG 3 630 

GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I M I I I I I I I I I I I I I I I I I I Ml I I I I M I I 

GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3690 

CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

MINI I I I I Mill II I II I I I II I I I I I I I I I I I I II I I I M I I I I I II 
CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 

GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 8 0 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I M I I I II I IN 

CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 

CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 384 0 

Ml | | I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M 

CTCAGAGATGCAAGTGTCCCAGTTCATCCGCAAGCATGTGGCTTCCTCCCTGCTGGTGTC 387 0 

AGACAC AAGCAC G GAGCT CT C CT ACAT C CT G CC CAGC GAG G C C G C CAAGAAGG G GGCT TT 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I MINI I I I I I M 

AGACAC GAG C AC C GAGCT CT C CT AC AT C C T G C C C AG C GAG G CT GT CAAG AAAG G G GC CT T 3930 

CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I M I I I M I I I I I I I I I I II I I I I II I I I I I I I I I I I M I I I M M II 
CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 

GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4 02 0 

II I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I M I M M II I I I I I II 

GCT GAT G GACAC AAC C C T GGAGGAG GT GT T C CT CAAG GT GT CT GAAGAAGAC C AGT C ACT 4 050 



4021 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4080 

I I I I I I I I I I I II I I I I I I I MINIMI M II I M M 

4 051 GGAGAAT AGT GAGG C C GAT GT GAAGG AGT C C C G GAAG GAT G CACT GC CT GG GG C AGAGGG 4110 

4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

II I I I I I II I I II I I I I I Mill I I I I I I I I M I I 

4111 CCTGACGGCTGTGGAGAGTCAAGCAGGCAACCTGGCTCGGTGCTCAGAGCTGGCACAGTC 4170 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 00 

I I I I I || I II I I I II II II I I II I I I I I I I I I I I I I I I II I I I I I MMI 
4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 4230 

42 01 CTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCAGACAA 42 60 

II II M I I I M III II I I II II II I I I II I I I I I I Ml I I I II I I I 

4231 CTACACCGACGGCTACGGTGACTACCGTCCCCTCTTTGACAACTTGCAGGACCCAGACAG 4290 

4261 T GT C AGC CT GC AAGAG GT G GAG GC AGAGG C C CT GT C GAGG GT C G G C C AGG G C AG C C G C AA 4320 

| | | | I I I I I I I I I I I II I II I II I I I I I I I I II I I I I I I I II II I I I I 

42 91 TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

Ml || Ml II I I I I I I I I II I I I II I I I I I I I M I I M I I II I I I I 

4351 GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

Ml I I M I II I I II II I I I M II I I I I I I I M II II I I M 

4411 CTGTGCTCGCCGGAACTCCAAAGCGCTCTGCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 4470 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

Ml I I || I I I II I I I II I I I I I I II I I I I I I I I II I I I I I I I I M IMM 
4471 CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4530 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4 5 60 

I | | | || I I II I I II I I I I I I I I I II I I I I M I I II I I I I I II II I I I II M I II 

4531 CCTGTCGCCTTCTCAGTACCACAACTATACCCAGCCCCGTGGCAACTTTATCCCCTATGC 4590 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 462 0 

Ml Mill I I I I I I II I I Mill II M II I 

4591 C AAT GAG GAAC GC CG C GAGT AC C GAT T AC GGCT GT C AC CT GAT G C C AG C C C C C AGCAGT T 4 650 

4 621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I II II I I I II I II I I I I M M I I I I M I I II I II Ml I M M I II 

4651 GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

M || || I II II II I I II II I Mill I I II II I II I I I I I II I I I I I I I I I M 
4711 CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 47 7 0 

47 41 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

M II II M I I I I II I M M I I M I M I I II II I II I I I I M I I I M M I II II I II 
4771 ACGGTTCTTCGACAGTATGTGCCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAACTT 48 30 

4 801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA 4 857 

I I II II I I II I I I II II I II II I II II II I I I I I II I M II I I M II I I I I 
4831 CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 4 8 90 



4858 CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4917 

| | | | | | | | | | I I | I I I I I I I I I I I I I I I I I I I I I I I I I 

4 8 91 ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4 950 

4 918 ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4 977 

|| || | | | | | I I I I I I I I I I I I I I I M I I I I I I I I I I I MINIM 

4951 GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

4 978 CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 

M | I I I I I II II M M I I I I I M II II II II I I M II I I I I I I I M II I M II 

5011 GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 5070 

5038 C G AC AT C C T G AC C G AC AT C AC C G G C C AC AAT G T C T C T G AGT AC CTGCTCTT C AC C T C C G A 5097 

| | | | M || || | I I II I I I I I I I I M I II I I I II II II I I I I I I II I I II I II I II 
5071 GGACATCCTGACTGACATCACCGGCCACAATGTTTCCGAGTACCTGCTCTTCACCTCTGA 5130 

5 0 98 CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCC 5157 

| | | | | I I II I I II I II I Mill I I I I II M II I I I I II I I I I I I I II I I I II I 
5131 CCGTTTCCGACTGCACCGCTATGGAGCCATCACCTTTGGTAATATCCAGAAGTCCATCCC 5190 

5158 AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

Ml | | M I II I I I I I I I I I I I I I I I II I I M I II II II I I I II M 
5191 AGCACCCATTGGTACCCGGACCCCTCTCATGGTCCGGAAGATTGCAGTGCGGAGGGTGGC 5250 

5218 C CAG GT T T T C T AC AAC AACAAGG G CT AT CACAG CAT GC C C AC CT AC CT C AAC AGC CT CAA 5277 

| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II II II I M I I I I I 
5251 CCAGGTGCTCTACAACAACAAGGGCTACCACAGCATGCCCACCTACCTCAACAGCCTCAA 5310 

52 78 CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

Ml | | | I I I I II II I Mill II II II II I II M II M I I I II M 

5311 CAATGCCATTCTGCGTGCAAACCTACCCAAAAGCAAGGGCAATCCAGCAGCCTACGGTAT 5370 

5338 CACCGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCT 5397 

I I I I I I I I I I II II I I I I I II I I I I I II II I I II I I I I I I I II I I II I I M 

5371 C AC C GT C AC C AAC C AC C C CAT GAAC AAG AC C AGT G C TAG CCTCTCCCTG GAT T AC CT AC T 5430 

5398 GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

| || | || || | || II I I II I I I II I I I II I II M I II I I II II I I II I II II II II I I 
5431 GCAGGGCACAGACGTGGTCATCGCCATCTTCATCATTGTGGCCATGTCCTTCGTGCCGGC 5490 

5458 C AGCT TCGTTGTCTTCCTCGTGGCC GAG AAGT C C AC CAAG GC C AAGC AT CT GC AGT T T GT 5517 

| | | M II I I I II II M I I M M II II II II II I M I II I II I M I II I I II I II 
5491 CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 

5518 CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 5577 

I I I I M I I I II I II I I I II I I I M M I M I II I I II II II I II I I II I I M I M 

5551 CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 

557 8 CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 5637 

I I I I I I I I I I I II I II I II II II I I II II II IMM II II II I I I I I 

5611 CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 5670 

5638 GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

| | | | | || || I I I II I II M II MINI I I II II II M II I II II II I I I I II I 
5 671 GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 5730 

5698 GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 5757 



5731 ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 5790 

5758 CATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCT 5817 

Ml MINI I I I I Ml I I I I I I I I I I I I I I II I I I I I 

57 91 CATCGTCATCAACCTCTTCATTGGCATCACGGCCACAGTGGCCACCTTCCTTCTGCAGCT 5850 

5818 CT T C GAG C AC GACAAG GAC CT GAAG GT T GT C AAC AGT T AC C T G AAAAG CT GCT T C C T CAT 5877 

Ml | | | I I Ml I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5851 CT T T GAG CAT GACAAGGAT C T GAAGGT T GT C AAC AGTT AC CT GAAAAGCT G CT T C CT C AT 5910 

587 8 TTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAA 5937 

| I I M | I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I I 

5911 CT T C C CCAACT AC AAC CT GGG C CAC G GACT CAT GGAGAT AG C CT AC AAC GAAT AC AT CAA 597 0 

5938 CGAGT ACTACGCCAAGATT GGCCAGT TT GACAAGAT GAAGT CC CCGTT CGAGT GGGAC AT 5997 

| | I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I II II I I I 

5971 C GAAT AC TAT GC C AAGAT C G GC C AGT T T GACAAGAT GAAGT C C C C GT T T GAGT GG GAC AT 6030 

5998 TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 6057 

| | | | I I || I M I II I I I I II I I I I II I I I I I I II I II I I III I II I I I I I 
6031 TGTCACACGTGGACTGGTGGCCATGACAGTCGAGGGCTTCGTGGGATTCTTTCTCACCAT 6090 

6058 CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 6117 

| | I I I I || II I I I II I I I I I I I I MINIM IN 

6091 CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTAAACCTGT 6150 

6118 GGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAA 6177 

Ml II Mill II I II II I II II I II II M I II I II I II II M II II Mill 

6151 GGAAGACGATGTAGACGTGGCCAGTGAGCGGCAAAGAGTGCTCCGTGGCGATGCTGACAA 6210 

617 8 TGACATGGT CAAGATT GAGAACCT GACCAAGGT CTACAAGT CCCGGAAGATT GGCCGT AT 6237 

I || || || II I II I II I I M I II II M M I M I M Mill II 

6211 T GACAT GGT CAAGAT C GAGAACCT GACT AAGGT GT ACAAGT CT CGGAAGAT C GGC CG C AT 6270 

6238 CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 6297 

IMIM M I II II II I I I I I I M I I M I II II II I II I II I I II II M II M 

6271 CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 6330 

6298 CGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGAC 6357 

| | || | | | | M II II II II M I II I II II I I M I I I I I M M M M I I I I II 
6331 GGT CAAT GGTGCCGGGAAGAC CAG CAC CTT CAAGAT GTTGACT GGAGAT GAGAGCACAAC 639 0 

6358 GGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCA 6417 

I || II II I II II I I II II Ml M M I I I I I I I M 

63 91 AGGGGGCGAGGCCTTTGT CAAT GGACACAGTGT GCT CAAGGACCTGCTCCAGGTTCAGCA 6450 

6418 GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 6477 

MUM II I I II I I II I I I I I I M I I II I II II I II I I II 

6451 GAGCCTTGGCTACTGCCCACAGTTCGACGCCCTGTTCGATGAGCTCACGGCTCGCGAACA 6510 

647 8 CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 6537 

II I II II I M I I II II II I II II Ml II II I I I II I Mill I M M M II 

6511 CCTGCAGCTGTATACTCGGCTTCGAGGCATCCCCTGGAAGGATGAGGCGCAGGTGGTGAG 6570 

6538 GTGGGCTCT GGAG AAGCT G GAG C T GAC C AAGT AC GC AG AC AAGC C GGC T GGC AC C T AC AG 6597 
I I I II I I II I M II II II I I I M II I I II I M M I I I M M II II I I I I I I I 



Db 


6571 


Qy 


6598 


Db 


6631 


Qy 


6658 


Db 


6691 


Qy 


6718 


Db 


6751 


Qy 


6778 


Db 


6811 


Qy 


6838 


Db 


6871 


Qy 


6898 


Db 


6931 


Qy 


6958 


Db 


6991 


Qy 


7018 


Db 


7051 


Qy 


7078 


Db 


7111 


Qy 


7138 


Db 


7171 


Qy 


7198 


Db 


7225 


Qy 


7258 


Db 


7285 


Qy 


7318 


Db 


7345 


Qy 


7378 


Db 


7397 



GT GGGCC CT GGAGAAGCT GGAGCT GACGAAGT GT GCAGACAAGC C AGC C GGT AGCT ACAG 6630 

CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 6657 

II | II M I I I Mill II I II I I I I II M I I I M I M I I I I II I I I I I II I I I 
TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 6690 

CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 6717 

Ml || I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 6750 

CAT C C T C G AC C T CAT C AAG AC AG G G C GT T C AGT G GT GC T G AC AT C AC AC AG CAT G GAG G A 6777 

M I II M II I I I I I I I I M I I I I I M I I M I I I I I I I I I I I 

CAT T CT G GAC CT CAT CAAG AC AGGAC GT T C AGT GGT G C T GAC CT CACAC AGC AT GGAG GA 6810 

GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 68 37 

I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I M I I MINIM 

ATGCGAGGCTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 6870 

C AGC AT C C AGC AC C T GAAG AAC C G GT T T GGAGAT G GCT AC AT GAT C AC G GT G C G GAC C AA 6897 

Ill I II I I I I M II I I I I I M M II I I I I I 

GAGTATCCAGCAC CT CAAGAACAGGTT T GGGGACGGCTACAT GAT CACT GTAAGGAC CAA 6930 

GAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCAT 6957 

M II I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I 
AAG C AG C C AGAAC GT GAAG GAT GT GGT GC GGT T C T T CAAC C G GAACT T C C C AGAG GC C AT 6990 

GCT CAAGGAGC GG CAC C AC AC AAAGGT GCAGT AC CAGCT CAAGT C G GAG CACAT CT C GCT 7017 

M I II I I I I II I I I I I II I I I I I I I I M I I I I I I I I I I II I I I I I I II I I I M I I 

GCTCAAGGAACGCCACCATACGAAGGTGCAGTATCAGCTCAAGTCGGAGCACATCTCGCT 7050 

GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 7077 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 

GGCTCAGGTGTTCAGCAAGATGGAGCACGTGGTCGGTGTACTGGGCATCGAGGACTACTC 7110 

GGT CAGC CAGACCACACTGGACAAT GT GTT CGTGAACTTT GCCAAGAAGCAGAGTGACAA 7137 

II I I II I II I I I II Mill II I I I I I I I I II I II I I I I I I II I I I I II 



CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 7197 
I | | I || I I I I II I I I I I I II I M I II I I I I II I I I I I Ml 



CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 7257 

I I I I I I I I I I I I I I I I MM I I I I I I II I I I I I I I 

TAGCCTGCTGCGGCCCCGCCCTGCACCCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 7284 

C GAG GAC CT GGACAC G GAGGACGAG G G C CT CAT CAGCT T C GAGGAGGAG C G GG CC C AG CT 7317 

|| I II II I I I I I I I I I I M I I I I II I II I I II I I I I I I M M II I I II I I II II M M 

T GAGGAC CT G GAC AC GGAG GACGAGGGC C T CAT CAG CT T C GAGGAAGAG C GGGC C C AG C T 7344 

GT C C T T CAAC AC G GAC AC GCTCTGCT GAC CAC C C AG AG C T G G G C C AG G GAG GAC AC G C T C 7377 
|| | M II I I II M II I I I I II II I II I II II II I I II I 

CT C CT T C AACAC C GAT AC GCTCTGCT GAC GT T C AAGAGT C AC AT CAGG GAT G 7396 



I I 



I I 



I I 



I II I 



Qy 7 438 TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 7496 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I 
Db 744 6 TGCCAGGCCCTGGAAAGGCAGGTTCAGGACCAAAGGGCTCCCGCCCTCC 7494 

Qy 7497 CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCG 7556 

III I I III I I I I I I I I I I I I I I I II 

Db 7495 TCCCAACTACCATCCTCCCCGATCGTGCCAAAGGCTGGGCTG 7536 

Qy 7557 GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7615 

I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 
Db 7537 GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGTCCTGGCCCAGC 7596 

Qy 7 616 CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 7 673 

M I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 7597 CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 7656 

Qy 7 674 GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 7733 

I I II I I III I II M I 

Db 7 657 TGTGACCCTTCTCTGCAGCGGCCACCAGTCTACCCAGGCCAGCATCTTGCACAGATGTCT 7716 

Qy 7734 GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 7792 

I || I I I I I III I I I I I I I I I I I II I I I I I I I I I I I 
Db 7717 TTCATGAAAAGACTGCAGTTGGGGAGGTGGCAGCTTGCCTACTTATTTTGCTTTAAGA — 7774 

Qy 7793 AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 7852 

I I I I III II II I I I I III I I I I I I I I I I I 

Db 7775 GCCTCCCTCACTCTGCTGTTGTGAAGAAGTTAGGCTACCATGGGAAGCCATGAATG 7830 

Qy 7853 TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 7905 

I I I || I I I I I I II I I I I I I I I I I I I I II I I I I II I 

Db 7 831 TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGCTAGGTG 78 90 

Qy 7906 AGGGGCCA GACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 7960 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7891 AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 7 94 9 

Qy 7961 CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 8020 

I I I I M I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7950 -CCCTTCCT GC C AC C CAT GT G G GAGT AG GAC CTT GT AT AT AGCAC ACAGAT GT TT GT TT T 8008 

Qy 8 021 AAAT AAAT AAACAAAAT G 8038 

I I I I I I II I I I I I I I 
Db 8 00 9 C AAT AAAT AAG C AAAAAG 802 6 



RESULT 10 
AAD27271 

ID AAD27271 standard; cDNA; 5540 BP. 
XX 

AC AAD27271; 
XX 

DT 09-APR-2002 (first entry) 
XX 

DE Human transporter and ion channel-18 (TRICH-18) cDNA. 
XX 

KW Human; transporter and ion channel-18; TRICH-18; neuroprotective; asthma; 



KW nootropic; cytostatic; cardiovascular; immunosuppressive; cardiomyopathy; 

KW antiinflammatory; protein therapy; akinesia; cystic fibrosis; leukaemia; 

KW Bell's palsy; amyotrophic lateral sclerosis; Alzheimer's disease; cancer; 

KW amnesia; dementia; myocarditis; Duchenne 1 s muscular dystrophy; AIDS; 

KW Acquired Immune Deficiency Syndrome; Addison's disease; allergy; angina; 

KW cell proliferative disorder; psoriasis; cardiac disease; hypertension; 

KW bradyarrythmia; gene expression; drug screening; ss. 
XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 36. .5351 

FT /*tag= a 

FT /product= "Human TRICH-18 protein" 
XX 

PN WO200192304-A2. 
XX 

PD 06-DEC-2001. 
XX 

PF 25-MAY-2001; 2 001WO-US017065 . 
XX 

PR 26-MAY-2000; 2000US-0208424P . 

PR 01-JUN-2000; 2 000US-0209001P . 

PR 08-JUN-2000; 2000US-0210588P . 

PR 16-JUN-2000; 2000US-0212335P . 

PR 22-JUN-2000; 2000US-0213747P . 

PR 29-JUN-2000; 2000US-0215391P . 
XX 

PA (INCY-) INCYTE GENOMICS INC. 
XX 

PI Thornton M, Walia NK, Yue H, Nguyen DB, Lai P, Gandhi AR; 

PI Tribouley CM, Yao MG, Ramkumar J, Au- Young J, Lu Y, Tang YT; 

PI Azimzai Y, Bruns CM, Griffin JA, Yang J, Sanjanwala MS , Raumann BE; 

PI Lee EA, Hafalia A, Baughn MR, Green BD, Khan FA, Kearney L; 

PI Elliot VS, Seilhamer JJ, Policky JL, Borowsky ML, Burford N, Ding L; 

PI Lu DAM, Hillman JL; 

XX 

DR WPI; 2002-122055/16. 

DR P-PSDB; AAE16781. 
XX 

PT New human transporters and ion channels (TRICH) polypeptides useful for 

PT diagnosing, treating or preventing disorders associated with aberrant 

PT expression of TRICH. 
XX 

PS Claim 11; Page 201-202; 210pp; English. 
XX 

CC The invention relates to human transporters and ion channels (TRICH) 

CC polypeptides and their cDNA molecules. The nucleic acid and polypeptide 

CC sequences are useful in the diagnosis, treatment, and prevention of 

CC disorders associated with transport (akinesia, cystic fibrosis, Bell's 

CC palsy, amyotrophic lateral sclerosis); neurological (Alzheimer's disease, 

CC amnesia, dementia); muscle (cardiomyopathy, myocarditis, Duchenne's 

CC muscular dystrophy); immunological (AIDS, Addison's disease, allergies, 

CC asthma); cell proliferative disorders (cancers, leukaemia, psoriasis); 

CC cardiac disease (angina, hypertension, or bradyarrythmia) and in the 

CC assessment of the effects of exogenous compounds on the expression of 

CC nucleic acid and amino acid sequences of transporters and ion channels. 



CC The polynucleotides may be used to detect and quantify gene expression in 

CC biopsied tissues in which TRICH expression may be correlated with a 

CC disease, to generate hybridization probes for mapping naturally occurring 

CC genomic sequence, and in drug screening. The present sequence is human 

CC TRICH- 18 cDNA 

XX 

SQ Sequence 5540 BP; 1032 A; 1823 C; 1650 G; 1035 T; 0 U; 0 Other; 

Query Match 68.9%; Score 5536.8; DB 6; Length 5540; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5538; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

T C T AC T T C C T C T AC GGCTTCGTCTG GAT C C AG G AC AT GAT G GAG C G C G C CAT CAT C G AC A 2 054 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I II I I I I I I I I I I I I I I I I 
T C TACT T C CT CT AC GG CT T C GT CT GGAT C C AGGAC AT GAT GGAGC GC GC CAT CAT C GAC A 60 

CTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCT 2114 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I M I I I I 

CTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCT 120 

GCTACACACGCGAT GACTTCCT GTTT GT CATT GAGCACAT GAT GCCGCT GT GC AT GGT GA 217 4 
I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
GCT ACAC AC G CGAT GACT T C CT GT T T GT CAT T GAGCACAT GAT GC C GCT GT GC AT G GT GA 180 

T CT CCT GG GT CT ACT C C GT GGC CAT GAC CAT C CAGC AC AT C GT GG C GGAGAAG GAG C AC C 2234 
I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T CT C CT GGGT CTACTC CGTGGC CAT GAC CAT C CAGCACATC GT GGCGGAGAAGGAGCACC 240 

GGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGT 2294 
I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GGCT CAAGGAGGT GAT GAAGAC CAT G G G C CT GAAC AAC G C G GT GCAC T GGGT G GC CT G GT 300 

T CAT C AC CGGCTTTGT GC AGCT GT C CAT CT C C GT G AC AG C ACT CAC C GC CAT CCT GAAGT 2354 
I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
T CAT CACC GGCT TT GT GCAGCT GT C CAT CT C CGT GACAGCACT CACCGCCAT C CT GAAGT 3 60 

ACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACG 2 414 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACG 420 

CGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGG 2 474 

I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I 

CGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGG 4 8 0 

CCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGA 2534 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGA 54 0 

TCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCA 2594 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
T C CGAGAGGAGGT GGC GCAT GAT AAGAT CAC GG C C T T CGAGAAGT G CAT CGCGTCCCT C A 600 

TGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCG 2 654 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCG 660 



Qy 


1995 


Db 


1 


Qy 


2055 


Db 


61 


Qy 


2115 


Db 


121 


Qy 


2175 


Db 


181 


Qy 


2235 


Db 


241 


Qy 


2295 


Db 


301 


Qy 


2355 


Db 


361 


Qy 


2415 


Db 


421 


Qy 


2475 


Db 


481 


Qy 


2535 


Db 


541 


Qy 


2595 


Db 


601 



Qy 



2655 TGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGC 2714 



Db 661 TGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGC 72 0 

Qy 2715 TCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACA 2774 

I II I I I i I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I M II I I I I I I I I I 
Db 721 TCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACA 7 80 

Qy 2775 TTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGA 2 834 

I I II I I I I I I I I I I I I II I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I II II I I I 
Db 781 TTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGA 84 0 

Qy 2 835 AGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCAC 2 894 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 841 AGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCAC 900 

Qy 2895 GCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCT 2954 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 9 01 GCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCT 960 

Qy 2955 TTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGG 3014 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGG 102 0 

Qy 3015 ACAAAC T CAC CAAGGT CT ACAAGGAC GACAAGAAGCT GGC CC T GAACAAG CT GAGC CT GA 3074 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 ACAAACT CAC CAAGGT CT ACAAGGAC GACAAGAAGCT GGC CC T GAACAAG CT GAG C CT GA 1080 

Qy 3075 ACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCA 3134 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 10 81 ACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCA 1140 

Qy 3135 CCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGC 3194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I 
Db 1141 CCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGC 1200 

Qy 3195 AC GACAT C C G CAC G GAGAT GGAT GAGAT C C GCAAGAAC C T G GGC AT GT G C C C G C AG CAC A 3254 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 12 01 AC GACAT C CG C AC GGAGAT G GAT GAGAT C C GCAAGAAC CT G GGC AT GT G C C C G C AG CAC A 1260 

Qy 32 55 ATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGA 3314 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 ATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGA 1320 

Qy 3315 GCATGGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT 3374 

I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GCATGGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT 138 0 

Qy 3375 CCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCG 3434 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCG 1440 

Qy 34 35 TGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCG 34 94 

M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 14 41 TGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCG 1500 

Qy 34 95 TGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCA 3554 

I I I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 



Db 1501 TGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCA 1560 

Qy 3555 CCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCA 3614 

I I I I I M I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 CCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCA 1620 

Qy 3615 TCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATG 3674 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

Db 1621 TCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATG 1680 

Qy 367 5 GCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGC 3734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1681 GCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGC 1740 

Qy 3735 CAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGG 37 94 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I II I II I I I I 
Db 1741 CAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGG 1800 

Qy 3795 TGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGG 3854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 01 TGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGG 18 60 

Qy 3855 AGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCC 3914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 AGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCC 1920 

Qy 3915 AG CAC CT G GAGCGC AG C CT GGAT GCACT GC AC CT CAGCAG CTTCGGGCT GAT G GACAC GA 3974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 1921 AGCACCTGGAGCGCAGCCT GGAT GCACT GCACCTCAGCAGCTTCGGGCT GAT GGACACGA 1980 

Qy 3975 CC C T G GAGGAAGT GT T CCT C AAGGT GT C G GAG GAG GAT CAGT C G C T G GAGAAC AGT G AGG 4 034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1981 C C CTGGAGGAAGT GT T CCT CAAGGT GT CGGAGGAGGAT CAGT C GCTGGAGAACAGT GAGG 2040 

Qy 4035 CCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGG 4094 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 CCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGG 2100 

Qy 4095 AGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGC 4154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGC 2160 

Qy 4155 AGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCT 4214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCT 2220 

Qy 4215 ATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCAGACAATGTCAGCCTGCAAG 4274 

I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2221 AT G G C G AC T AC CGCCCCCTCTTT G AT AAC C CAC AG G AC C C AG AC AAT GT C AG C C T G C AAG 2280 

Qy 42 75 AGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGT 4334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 AGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGT 2340 

Qy 4335 GGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCA 4394 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 2341 GGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCA 2 4 00 



Qy 4 39 5 ACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGA 44 54 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 4 01 ACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGA 24 60 

Qy 4455 CCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCC 4514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2461 CCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCC 2520 

Qy 4 515 AGT AC C AC AAC TAG AC C C AG C C C C GT GG C AAT T T CAT C C C C T AC G C C AAC GAG GAG C G C C 4574 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 AGT AC C AC AAC T AC AC C C AG C C C C GT G G C AAT T T CAT C C C C T AC G C C AAC GAG GAG C G C C 258 0 

Qy 4575 GCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCC 4634 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I II I I I I 
Db 2581 GCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCC 2 64 0 

Qy 4635 GGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGG 4694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2 641 GGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGG 27 00 

Qy 4 695 GGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACA 4754 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I I I I I I I I I 
Db 27 01 GGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACA 2760 

Qy 47 55 GCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCAC 4814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I 
Db 27 61 GCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCAC 282 0 

Qy 4 815 CCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACG 4 874 

M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2821 CCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACG 288 0 

Qy 4 875 TCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCC 4934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 TCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCC 2940 

Qy 4 935 TGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCA 4 994 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 TGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCA 3000 

Qy 4995 GCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGACA 5054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3001 GCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGACA 3060 

Qy 5055 TCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACC 5114 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
Db 3061 TCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACC 3120 

Qy 5115 GGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCA 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3121 GGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCA 318 0 

Qy 5175 GGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACA 5234 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 GGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACA 3240 



Qy 5235 ACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTG 5294 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 
Db 3241 ACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTG 3300 

Qy 5295 CCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACC 5354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 CCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACC 3360 

Qy 5355 CCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCG 5414 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 C CAT GAAT AAGAC C AG C GC CAGC CTCTCCCTG GAT T AC CT GCT G C AGG G C ACG GAT GT CG 3420 

Qy 5415 TCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCC 5474 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3421 TCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCC 3480 

Qy 5475 TCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCA 5534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3481 TCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCA 354 0 

Qy 5535 TCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCT 5594 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 TCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCT 3600 

Qy 5595 GCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCC 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I 
Db 3601 GCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCC 3660 

Qy 5655 CTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGG 5714 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 CTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGG 3720 

Qy 5715 CCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCT 5774 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 CCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCT 3780 

Qy 5775 TCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGG 58 34 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 3781 TCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGG 3840 

Qy 5 8 35 ACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACC 5894 

I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 ACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACC 3900 

Qy 58 95 T GGGC C AC GG GCT C AT GGAGAT GG C CT ACAAC GAGTAC AT C AAC GAGT ACT AC GC C AAGA 5954 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 3901 TGGGCCACGGGCT CAT GGAGAT GGCCTACAAC GAGT ACATCAAC GAGT ACTACGCCAAGA 3960 

Qy 5955 TTGGCCAGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGG 6014 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 T T GGC C AGT T T GAC AAGAT GAAGT C CC C GTT C GAGT GGGACATT GT CACC C GC GGACT GG 4020 

Qy 6015 TGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACT 6074 

I II II I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 021 TGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACT 4080 



Qy 



607 5 TCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACG 6134 



1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 

Db 4081 TCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACG 4140 

Qy 6135 T G G C CAGT GAGC G GC AG C GAGT GCTCCGGG GAGAC G C C G ACAAT GAC AT GGT C AAGAT T G 6194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 T G G C CAGT GAGC G G C AG C GAG TGCTCCGGG GAGAC G C C GAC AAT GAC AT GGT C AAGAT T G 4200 

Qy 6195 AGAACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCC 6254 

I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I M I I I II I II I I I I I I 

Db 4201 AGAACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCC 4260 

Qy 6255 TGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCA 6314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I 
Db 4261 TGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCA 4320 

Qy 6315 AGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCG 6374 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I 
Db 4321 AGAC CAGC AC CT T CAAGAT GC T GAC C GG C GAC GAGAG C AC GACG G G GG GCGAGG C CTT C G 438 0 

Qy 6375 TCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCC 6434 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4381 TCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCC 444 0 

Qy 6435 CGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGC 6494 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 4441 CGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGC 4500 

Qy 64 95 GGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGC 6554 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4501 GGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGC 4560 

Qy 6555 T G GAG CT GAC C AAGT AC GC AG AC AAG C C GG CT GGC AC CT AC AG C G G C G G CAAC AAGC G GA 6614 

II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4561 TGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGA 4 620 

Qy 6615 AGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCA 6674 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 621 AGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCA 4 68 0 

Qy 6675 CCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCA 6734 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCA 4740 

Qy 6735 AGACAGGGCGTT CAGTGGT GCT GAC AT C AC AC AG CAT G GAG GAGT GC GAGGCGCT GT GCA 6794 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I 
Db 47 41 AGAC AGGG C GTT CAGT G GT GC T GAC AT CAC ACAG CAT GGAG GAGT GC GAGG CGC T GT GCA 4800 

Qy 67 95 CGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGA 6854 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4801 CGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGA 4860 

Qy 6855 AGAAC C GGT T T GGAGAT GG CT AC AT GAT CAC GGT GC G GAC C AAGAG C AG C C AGAGT GT GA 6914 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 8 61 AGAAC C G GT T T G GAGAT GGCT AC AT GAT CAC G GT G C G GAC C AAGAG C AG C C AGAGT GT GA 4 92 0 

Qy 6915 AGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACC 6974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 



4 921 AGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACC 4 98 0 



Qy 6975 ACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCA 7 034 

I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 4 981 ACACAAAG GT G C AGT AC C AGCT C AAGT C G GAGC AC AT CT C G C T GG CC C AG GT GT T CAGC A 5040 

Qy 7 035 AGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACAC 7094 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 5041 AGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACAC 5100 

Qy 7 095 T G G AC AAT GTGTTCGT GAAC T T T G C C AAG AAG C AG AGT G AC AAC C T G GAG C AG C AG GAGA 7154 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I 
Db 5101 T G GACAAT GT GT T C GT GAACT T T G C C AAGAAGC AGAGT GACAACCT GGAG CAG C AG GAGA 5160 

Qy 7155 CGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCC 7214 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5161 CGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCC 5220 

Qy 7215 GGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGG 7274 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5221 GGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGG 52 8 0 

Qy 7275 AG GAC GAG G G C C T CAT CAG CT T C GAG GAG GAG C G G GC C C AGC T GT C CT T C AAC AC GGAC A 7334 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 5281 AG GAC GAG G G C C T CAT CAG CT T C GAGGAGGAGC G GGC C C AGCT GT C CT T CAAC AC GGAC A 5340 

Qy 7335 CGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGC 7394 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 5341 CGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGC 5400 

Qy 7395 TGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTG 7454 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5401 TGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTG 5460 

Qy 7455 GAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGG 7514 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5461 GAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGTCCTGCGG 5520 

Qy 7515 TCACTGCGGTTGCCGCCCCT 7534 

I I I I I I I I I I I I I I I I I I I 
Db 5521 TCACTGCGGTTGCCGGCCCT 5540 



RESULT 11 
AAS62249 

ID AAS62249 standard; cDNA; 2740 BP. 
XX 

AC AAS62249; 
XX 

DT 14-FEB-2002 (first entry) 
XX 

DE cDNA sequence #36 encoding novel human secreted protein. 
XX 

KW Human secreted protein; hyperprolif erative disorder; autoimmune disorder; 

KW immune deficiency disorder; blood disorder; inflammatory disorder; 

KW infectious disorder; gene therapy; antimicrobial; hepatotropic; 

KW immunosuppressive; antirheumatic; ss. 



XX 

OS Homo sapiens. 
XX 

PN WO200177291-A2. 
XX 

PD 18-OCT-2001. 
XX 

PF 29-MAR-2001; 2 0 0 1WO-US0104 85 . 
XX 

PR 06-APR-2000; 2000US-0195604P . 
XX 

PA (GEMY ) GENETICS INST INC. 
XX 

PI Wong GG, Clark HF, Fechtel K, Agostino MJ, Howes SH, Resnick RJ; 

PI Gulukota K, Graham JR; 

XX 

DR WPI; 2002-010900/01. 
XX 

PT New polynucleotides encoding secreted proteins useful for treating e.g. 

PT asthma, HIV and Crohn's disease. 

XX 

PS Claim 1; Page 91; 391pp; English. 
XX 

CC The present invention relates to the isolation of novel cDNA sequences 

CC which encode human secreted proteins. The cDNA sequences have been 

CC derived from a variety of human tissues. The invention also provides a 

CC method for producing proteins from these polynucleotide sequences. The 

CC proteins are useful for identifying compounds that modulate their 

CC activity and production, and the cell is also useful for identifying 

CC compounds that modulate expression of the polynucleotide sequences 

CC encoding the secreted proteins. The sequences of the invention are useful 

CC for treating diseases such as hyperprolif erative disorders (e.g. cancer), 

CC immune deficiency disorders (e.g. severe combined immunodeficiency 

CC (SCID)), autoimmune disorders (e.g. multiple sclerosis), blood disorders 

CC (e.g. thrombocytopaenia) , inflammatory disorders (e.g. arthritis) and 

CC infectious disorders (e.g. hepatitis) . The polynucleotide sequences of 

CC the invention are also useful in gene therapy. AAS62214-AAS62 838 

CC represent the cDNA sequences of the invention that encode for novel human 

CC secreted proteins 

XX 

SQ Sequence 2740 BP; 525 A; 892 C; 804 G; 519 T; 0 U; 0 Other; 

Query Match 34.0%; Score 2736.8; DB 6; Length 2740; 
Best Local Similarity 99.9%; Pred. No. 0; 

Matches 2738; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 53 01 TGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGA 5360 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1 T GC C CAAGAGC AAGG G CAAC CCGGCGGCT T AC GG CAT CAC C GT C AC C AAC CAC C C CAT G A 60 

Qy 5361 ATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCG 5420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 61 ATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCG 120 

Qy 5421 CCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGG 5480 

I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 121 CCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGG 180 



Qy 5481 C C G AG AAG T C C AC C AAG G C C AAG CAT C T G C AGT T T GT C AG C G G C T G CAAC C C CAT CAT C T 5540 

I M I I I I I I I I I I I I I I I I I I I I 1 I I I I M I I I I I I I I I I I I I I I II I I I I I I II I I I I I 
Db 181 C CGAGAAGTCCACCAAGGC CAAGCAT CT GCAGT TT GT CAGCGGCT GCAACC CCAT CAT CT 240 

Qy 5541 ACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTG 5600 

I | | | | | | | | || I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I II I I I I 
Db 241 ACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTG 300 

Qy 5601 TCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCG 5660 

I I I I I I I M I II I II I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I 
Db 301 TCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCG 360 

Qy 5661 TCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCT 5720 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 TCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCT 420 

Qy 5721 TCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCG 5780 

I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 TCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCG 48 0 

Qy 57 81 GCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGA 5840 

I | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4 81 GCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGA 54 0 

Qy 5 841 AGGTTGTCJ^ACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCC 5900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCC/UVCTACAACCTGGGCC 600 

Qy 59 01 AC G G GC T CAT GGAGAT GGC CT ACAAC GAGT AC AT CAAC GAGT ACT AC G C CAAGAT T GGC C 5 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AC G GG CT CAT GGAGAT G GC C T ACAAC GAGT ACAT CAAC GAGT ACT AC GC CAAGAT T GGC C 660 

Qy 5961 AGT T T GACAAGAT GAAGT C CC C GT T C GAGT G G GACAT T GT CACC C G C GGACT GGT G GC CA 6020 

I I I I I I I I I I M I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 661 AGT T T GACAAGAT GAAGT C C C C GT T C GAGT G GGACAT T GT CACC C GC G GAC T GGT G G C C A 720 

Qy 6021 TGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGC 6080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGC 780 

Qy 6081 GGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCA 6140 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 GGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCA 840 

Qy 6141 GTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGACATGGTCAAGATTGAGAACC 6200 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 GT GAG C G G C AGC GAGT GCT C C G G GGAGAC GC C GACAAT GACAT GGT CAAGATT GAGAAC C 900 

Qy 62 01 TGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCC 6260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 
Db 901 TGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCC 960 

Qy 6261 TGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCA 6320 

I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCA 1020 



Qy 6321 G C AC CT T CAAGAT GCT GAC C G GC GAC GAGAG C AC GAC GG GG G GC GAG GC C T T C GT C AAT G 6380 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATG 1080 

Qy 63 81 GAC AC AG C G T G C T G AAG GAG C T G C T C C AG GT G C AG C AGA G C C T C G G C T AC T G C C C G C AGT 644 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I I 1 I I I I I 1 M I I I I I I I I I I I I I I I 
Db 1081 GACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGT 114 0 

Qy 6441 GTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGC 6500 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGC 1200 

Qy 6501 GTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGC 6560 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGC 12 60 

Qy 6561 TGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCT 662 0 

I I I I I I II I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 TGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCT 1320 

Qy 6621 CCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAG 6680 

I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1321 C C AC GG C CAT C GC C C T CAT T GGGT ACC C AGC CT T CAT CT T C CT G GAC GAG C C C AC CAC AG 1380 

Qy 6681 GCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAG 6740 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 13 81 GCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAG 14 4 0 

Qy 6741 GGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGC 68 00 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGC 1500 

Qy 68 01 TGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACC 68 60 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1501 T G G C CAT CAT G GT GAACGGT CGCCTGCGGTGCCT GGG C AGC AT C CAG C AC CT GAAGAAC C 1560 

Qy 6861 GGT T T GGAGAT GG CT ACAT GAT CAC G GT G C GGAC C AAGAG CAG C C AGAGT GT GAAGGAC G 692 0 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
Db 1561 GGT TT GGAGAT GGCT ACAT GAT CACGGT GCGGAC CAAGAGCAGCCAGAGT GT GAAGGAC G 162 0 

Qy 6921 TGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAA 69 8 0 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 TGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAA 168 0 

Qy 6981 AG GT G C AGT AC CAG C T CAAGT C GGAGC ACAT C T C GC T GGC C CAGGT GT T CAG CAAGAT GG 7040 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1681 AGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGG 1740 

Qy 7041 AGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACA 7100 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I 
Db 1741 AGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACA 1800 

Qy 7101 AT GT GT T C GT GAAC T T T G C C AAGAAG C AGAGT GAC AAC C T G GAG CAG CAGGAGAC GGAGC 7160 

I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AT GT GT T C GT GAACT T T G C CAAGAAGC AGAGT GACAAC C T G GAG CAG CAGGAGAC G GAGC 18 60 

Qy 7161 CGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTG 722 0 



Db 18 61 CGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTG 1920 

Qy 7221 C C C C CAC G GAGCT C C G GGC ACTT GT G GC AGAC GAGC CC GAGGAC CT GGACAC GG AG GAC G 728 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 
Db 1921 C C C C C AC GGAG CT C C G GGCACTT GT GGC AGAC GAG C C C GAG G AC CT GGACAC G GAG GAC G 19 8 0 

Qy 7281 AGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCT 7340 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I M I I I I I I I I I I 

Db 1981 AGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCT 2 04 0 

Qy 7341 GCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCC 7400 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2 041 GCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCC 2100 

Qy 7401 AGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTT 7460 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2101 AGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTT 2160 

Qy 7 4 61 CAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTG 7520 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTG 2220 

Qy 7521 CGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCC 758 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 2221 CGGTTGCCGCCCCTAATTGTGCCAAAGGTTGACCCGGCCCGGGCTGCGTACACCCTTGCC 2280 

Qy 7581 CTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCA 7 640 

I I I I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 CTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCATGCCTGGCACTGCTCA 2340 

Qy 7641 CCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGG 7700 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 CCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGG 2400 

Qy 7701 AACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTG 7760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 AACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTG 2460 

Qy 7761 GGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAG 7820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 GGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAG 2520 

Qy 7 821 GGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGG 7 8 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 2521 GGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGG 2580 

Qy 7 8 81 AGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATC 794 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2581 AGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATC 2640 

Qy 7 941 GCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACAT 8000 

I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 2641 GCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACAT 2700 

Qy 8 001 AG C G CAC AG AT GTTTGTTT T AAAT AAAT AAAC AAAAT GT C 8040 

I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 



Db 27 01 AGC GCACAGAT GTT T GT TTT AAATAAAT AAACAAAAT GT C 2740 



RESULT 12 
AAZ94746 

ID AAZ94746 standard; cDNA; 7323 BP. 
XX 

AC AAZ94746; 
XX 

DT 01-AUG-2000 (first entry) 
XX 

DE Human ATP binding cassette ABCA5 cDNA. 
XX 

KW ABCA5; ATP binding cassette; human; cholesterol; lipid disorder; 

KW atherosclerosis; lipid disorder; dyslipidemia ; psoriasis; 

KW lupus erythematosus; diagnosis; gene therapy; chromosome 17q21-25; ss. 

XX 

OS Homo sapiens. 
XX 

PN WO200018912-A2. 
XX 

PD 06-APR-2000. 
XX 

PF 21-SEP-1999; 99WO-EP006991 . 
XX 

PR 25-SEP-1998; 98US-0101706P . 
XX 

PA (FARB ) BAYER AG. 
XX 

PI Schmitz G, Klucken J; 
XX 

DR WPI; 2000-293151/25. 
XX 

PT Adenosine triphosphate binding proteins useful for identifying agents for 

PT treating atherosclerosis and other inflammatory disorders. 

XX 

PS Claim 9; Page 126-129; 154pp; English. 
XX 

CC The present sequence is that of human ATP binding cassette subfamily A 

CC protein ABCA5 cDNA. The cDNA was identified using a differential display 

CC method in which monocytes from peripheral blood were subjected to 

CC macrophage differentiation and cholesterol loading with acetylated low 

CC density lipoproteins and subsequent deloading with high density 

CC lipoprotein (HDL3) to identify cholesterol sensitive genes. The gene maps 

CC to chromosome 17q21-25. The invention provides cholesterol-sensitive ABC 

CC genes (see AAZ94734-63) . These genes, and polypeptides encoded by them, 

CC can be used for diagnostic and therapeutic applications, and for 

CC biochemical or cell-based assays to screen for pharmacologically active 

CC modulator compounds useful for the treatment of lipid disorders, 

CC atherosclerosis or other inflammatory diseases such as psoriasis and 

CC lupus erythematosus 

XX 

SQ Sequence 7323 BP; 1796 A; 1976 C; 1853 G; 1698 T; 0 U; 0 Other; 

Query Match 12.3%; Score 991.4; DB 3; Length 7323; 
Best Local Similarity 52.9%; Pred. No. 2.3e-154; 

Matches 2802; Conservative 0; Mismatches 2261; Indels 234; Gaps 22; 



Qy 1879 CGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCCAGCTTCACCGAGAA 193 8 

I I I I I I I I I I I I I I I I I I I I I II II I I I III II I I I I I 

Db 17 67 CAGC T CT CT AC CAC C C CAC GT GAAGT AT AAGAT C C GAAT GGAC AT AGAC GT GGT G GAGAA 1826 

Qy 1939 AACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTA 199 8 

I I I I I I II I I I I I I I I I I I I I I II III I I 

Db 182 7 AAC CAAT AAGAT T AAAGAC AG GT AT T GGGAT T C T GGT C CCAGAGC T GAT C C C GT GGAAGA 18 86 

Qy 1999 CT T C CT C TAC GGCTTCGT CT GGAT C C AG GAC AT GAT G GAGCG C GC CAT CAT C G AC AC T T T 2058 

I I II I I I I I I I I I I I I I I I I I II 

Db 18 87 TTTCCGGTACATCTGGGGCGGGTTTGCCTATCTGCAGGACATGGTTGAACAGGGGATCAC 194 6 

Qy 2059 TGTGGGGCACGACGTGGTGGAGCCA GGCAGCTACGTGCAGATGTTCCCCTACCC 2112 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1947 AAGGAG C C AG GT GC AG G C GGAG G CT C C AGT T GGAAT CT AC CT C CAGCAGAT G C C C TAC C C 2006 

Qy 2113 CTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGT 2172 

I I II I I I I I I II I I I I III I I I III I I I I I I II 

Db 2007 CTGCTTCGTGGACGATTCTTTCATGATCATCCTGAACCGCTGTTTCCCTATCTTCATGGT 2 066 

Qy 2173 GATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGGAGAAGGAGCA 2232 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2067 GCT GGCATGGAT CT ACT CT GT CT CCAT GACT GT GAAGAGCAT C GT CTT GGAGAAGGAGTT 2126 

Qy 2233 CCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTG 22 92 

I I I I I I I I I I I I I I I III I I I I II I I I III I I I I 

Db 2127 GC GACT GAAG GAGAC CT T GAAAAAT CAG GGT GT C T C CAAT G CAGT GAT TT G GT GT AC C T G 2186 

Qy 2293 GT T CAT CAC CGGCTTTGTG CAG C T GT C CAT C T C C GT GAC AG CAC T CAC C G C CAT C C T G AA 2352 

I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2187 GT T C C T GGACAG CT T CT C CAT CAT GT C GAT GAG CAT CTTCCTCCT GAC GAT AT T CAT CAT 2246 

Qy 2353 GTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTA 2412 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2247 GCATGTAAGAATCCTACATTACAGCGACCCATTCATCCTCTTCCTGTTCTTGTTGGCTTT 2306 

Qy 2413 CGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCT 2472 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 2307 CTCCACTGCCACCATCATGCTGTGCTTTCTGCTCAGCACCTTCTTCTCCAAGGCCAGTCT 2366 

Qy 2473 GGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGC 2532 

III I I I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 2367 GGCAGCAGCCTGTAGTGGTGTCATCTATTTCACCCTCTACCTGCCACAC 2415 

Qy 2533 GAT C C GAG AG GAG G T G G C G CAT GAT AAGAT CAC G G C C T T C G AG AAGT G CAT CGCGTCCCT 2592 

MM I I II II MUM I I I I I I I I 

Db 2416 -ATCCTGTGCTTCGCCTGGCAGGACCGCATGACCGCTGAGCTGAAGAAGGCTGTGAGCTT 2474 

Qy 2593 CATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGG 2 652 

II I I II I I I II I II I I II I I I I I II I I I I II I I I II 
Db 2475 ACTGTCTCCGGTGGCATTTGGATTTGGCACTGAGTACCTGGTTCGCTTTGAAGAGCAAGG 2534 

Qy 2653 CGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTT 2712 

I II I I I I I I I I I I I I II I I II II I I I I I II I I I II I I II 

Db 2535 CCTGGGGCTG CAGT G GAGCAAC AT C G G GAAC AGT C C CAC GGAAGGG GAC GAAT T C AGC T T 2594 



Qy 2 713 GCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTA 2772 

I I I I I I I III II 1 I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2595 CCTGCTGTCCATGCAGATGATGCTCCTTGATGCTGCTGTCTATGGCTTACTCGCTTGGTA 2654 

Qy 2773 CATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCA 2832 

I I I I I III I II I I I I I I III I I I I I I I I II I I I I I 

Db 2655 CCTTGATCAGGTGTTTCCAGGAGACTATGGAACCCCACTTCCTTGGTACTTTCTTCTACA 2714 

Qy 2833 GAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGC 2892 

I I I I I I I I I II I I I I I I II I I I I I I II II 

Db 2715 AGAGT C GT AT T G GC TT GGC G GT GAAG G GT GT T CAAC CAGAGAAGAAAGAGC C CT GGAAAA 2774 

Qy 2 8 93 ACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCG 2952 

I I I I I I I I I I I II I I I I I 

Db 2775 G AC C GAG C C C C T AAC AG AG G AAAC G GAG GAT C C AG AG C AC C C AG AAG G AAT AC AC G AC T C 2 834 

Qy 2953 CTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGT 3012 

III I I I I I I I I I I I I I I I I I I I I 

Db 2835 CTT CTTTGAACGTGAGCATCCAGGGTGGGTTCCTGGGGTATGCGT 2879 

Qy 3013 GGACAAAC T C AC CAAGGT CT AC AAGGAC GACAAGAAG CT GG C C CT GAACAAG C T GAGC C T 3072 

I I I I I I I I I I I I I I I II I I I I I I Mill 

Db 2880 GAAGAATCTGGTAAAGATTTTTGAGCCCTCCGGCCGGCCAGCTGTGGACCGTCTGAACAT 2 93 9 

Qy 3073 GAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCAC 3132 

I I III I I I III I I I I I I I I I I II II II II II I I I 

Db 2940 CAC CTT CT AC GAGAAC CAGAT C AC C GC AT T C CT GG GC CAC AAT GGAG CT GG GAAAAC C AC 2999 

Qy 3133 CACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGG 3192 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II II II 

Db 3 000 CACCTTGTCCATCCTGACGGGTCTGTTGCCACCAACCTCTGGGACTGTGCTCGTTGGGGG 3 059 

Qy 3193 GCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCA 3252 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3 060 AAGGGACATTGAAACCAGCCTGGATGCAGTCCGGCAGAGCCTTGGCATGTGTCCACAGCA 3119 

Qy 3253 CAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAA 3312 

III I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3120 CAACATCCTGTTCCACCACCTCACGGTGGCTGAGCACATGCTGTTCTATGCCCAGCTGAA 3179 

Qy 3313 GAGCAT GGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT 3372 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 

Db 3180 AGGAAAGT CC CAGGAG GAG G C C C AGCT G GAGAT G GAAGC C AT GT T GGAG GACAC AGGC C T 3239 

Qy 3373 CTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTC 3432 

I I I II I I I I I I II III I I I I I I I I I I I I I I I I I I I I I I I 

Db 3240 CCAC CACAAGCGGAAT GAAGAGGCT CAGGAC CTAT CAGGT GGCAT GCAGAGAAAGCT GT C 3299 

Qy 3433 CGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGG 3492 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 3300 GGTTGCCATTGCCTTTGTGGGAGATGCCAAGGTGGTGATTCTGGACGAACCCACCTCTGG 3359 

Qy 3493 CGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCG 3552 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 3360 GGTGGACCCTTACTCGAGACGCTCAATCTGGGATCTGCTCCTGAAGTATCGCTCAGGCAG 3419 

Qy 3553 CACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGC 3612 



1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I 

Db 3420 AAC CAT CAT CAT GT C C AC T C AC C AC AT G GAC GAG G C C G AC CTCCTTGGG G AC C G CAT T G C 3479 

Qy 3 613 CATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTA 3672 

I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3480 CAT CATT GCCCAGGGAAGGCT CTACT GCTCAGGCACCCCACT CTTCCT GAAGAACTGCTT 3539 

Qy 3673 TGGCGACGGGTACCGCCTCACGCTGGT CAAGCGGCCCGCCGAGCCGGGGGGCCCCCA 3729 

I I I I III I I I I I I I I I I I I I I III I 

Db 354 0 T G G C AC AG G C T T GT AC T T AAC CTTGGTGCG C AAG AT G AAAAAC AT C C AG AG C C AAAG G AA 3599 

Qy 3730 AGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCT 37 89 

II I I I I I I I I I I I III I I I I I I I I 

Db 3 60 0 AGGCAGTGAGGGGACCTGCAGCTGCTCGTCTAAGGGTTTCTCCACCACGTGTCCAGCCCA 3659 

Qy 37 90 CCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAG 3849 

I III II I I I I I I III III III 

Db 3660 C GT C GAT GAC CTAACT C C AGAACAAGT CCT G GAT G GGGAT GT AAAT GAGCT GAT G 3714 

Qy 3850 CACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCT 3909 

I I I I I I I I I III II II I 
Db 3715 GAT GT AGTT CT CCAC CAT GT T C C AGAGG CA 3744 

Qy 3910 CTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGGGCTGATGGA 3969 

I I I I I I I I I I I I I III I III 

Db 3745 AAGCT GGT G GAGT G CAT T GGT CAAGAACT T AT CT T C C T T C TT CCAAAT AAGAA 37 97 

Qy 3970 CAC GACC CT GGAGGAAGT GTT C CT CAAGGT GT C GGAGGAGGAT CAGT CGCT GGAGAACAG 4029 

I II II II I I I I I I I I I I II I I I II 

Db 3798 CT T C AAG C AC AGAGCAT AT GC C AGC C T T TT C AGAGAG CT G GAG GAGAC GC T GG CT GACC T 3857 

Qy 4 030 TGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTC 4089 

M I I I I I I I I I I M I II II 

Db 3858 TGGTCTC AGCAGTTTTGGAATT T CT GAC AC T C C C CT GGAAGAGAT T T 3904 

Qy 4 09 0 TGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATC 4149 

I I I I I II I I I I I I I I I I I I I III 

Db 3905 TTCTGAAGGTCACGGAGGATTCTGATTCAGGACCTCTGTTTGCGGGTGGCGCTCAGCAGA 3964 

Qy 4150 GCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGA 4209 

I II I I I I I I I I I I I I I I I I I I I I 

Db 3965 AAAGAGAAAAC GT CAAC C C C C GAC AC CCCTGCTTGGGTCC C AGAGAGAAG G CT GGAC AGA 4024 

Qy 4210 C GT C T AT G G C GAC T AC CGCCCCCTCTTT GAT AAC C CAC AG GAC C C AG AC AAT GT C AG CCT 4269 

II II I I I I I I I I I I I I I I I I II 

Db 4 02 5 CACCCCAGGACTCCAATGTCTGCTC CCCAGGGGCGCCGGCTGCTCACCCAGA 4 07 6 

Qy 4270 GCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGG 4329 

I II I I I I I I II II I I I I I I II 
Db 4 077 G G GC CAG CCT C CC CCAGAG C C AGAGT GC C CAGGC C C GC AGCT CAAC ACGGG 4127 

Qy 4330 CGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCG 4389 

I I I I II II I I I I I II I I I I I I I I I I I I I I I Ml 

Db 412 8 GAC ACAG CT GGT C CT C CAG CAT GT G CAG GCGCTGCTGGT C AAGAGAT T C CAAC AC AC CAT 4187 



Qy 



4390 CCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGC 4449 
I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I I I M I I 



Db 418 8 CCGCAGCCACAAGGACTTCCTGGCGCAGATCGTGCTCCCGGCTACCTTTGTGTTTTTGGC 4247 

Qy 4 450 CATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACC 4509 

III I I I I I I I I I I I I I I I I I II Ml M 

Db 424 8 TCTGATGCTTTCTATTGTTATCCCTCCTTTTGGCGAATACCCCGCTTTGACCCTTCACCC 4307 

Qy 4510 T T C C C AGTACC ACAACT ACAC C CAGC C C C GT G GCAAT T T CAT C C C CT AC GC CAAC GAGGA 4569 

I II I I I I I I I I I I I I I II 

Db 4308 CTGGATATATGGGCAGC AGT AC AC C TT CT T C AGCAT GGAT GA 434 9 

Qy 4 57 0 GCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCAC 4 629 

I II I I I I I I I I MM I II I I I I I I 

Db 4350 ACC AG GC AGT GAG C AGT T CAC G GT ACTT GCAGAC GT C C T C CT GAAT AAG C - C AGGCT T T G 44 08 

Qy 4 630 GTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTC 468 9 

I I I I I M I II I I I I II I I I I I I I I III 
Db 44 09 GCAACCGCTGCCTGAAGGAAGGGTGGCTTCCGGAGTACCCCTGTGGCAACTCAA 44 62 

Qy 4690 GCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTT 4749 

I I I I I I I I I I 

Db 4 4 63 CACCCTGGAAGACTCCTTCTGTGTC 44 8 7 

Qy 475 0 CGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACC 48 09 

I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4488 CCCAAACAT CACCCAGCT GTT C CAGAAGCAGAAAT GGACACAGGT CAACCCTT CACCAT C 4547 

Qy 4810 CCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTG 4869 

I I III I I I II I I I I I I I I 

Db 4548 CTGCAGGTGCAGCACCAGGGAGAAGCTCACCATGCTGCCAGAGTGCCCCGAGGGTGCCGG 4607 

Qy 4870 GAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCC 4929 

I I I I I I I I I I I M III II I 

Db 4608 GGGCCTCCCGCCCCCC C AG AG AAC AC AG C G C AG CAC G G AAAT T C T AC AAG AC C T G AC G G A 4667 

Qy 4930 GCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTG 4989 

I I I I I I II I I I I I I I I I I I 

Db 4668 CAG GAAC AT CT CC GACT T CT T G GT AAAAAC GT AT CCTGCTCT T AT AAGAAG C AGCTT AAA 4727 

Qy 4990 CCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGAC 5049 

II III III I I I I I I I I I I I I 

Db 472 8 GAGCAAAT T CT GG GT CAAT GAACAGAGGT AT GGAG GAAT T T C CAT T GGAGGAAAGCT C C C 47 87 

Qy 5050 CGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACT 5109 

I I I I I I I II I I I I I I I II I 

Db 4788 AGTCGTCCCCATCACGGGGGAAGCACTTGTTGGGTTTTTAAGCGACCTTGGCCGGATCAT 4 847 

Qy 5110 GCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGG 5169 

II I Mill I I I I I I I I II II I I I I II 

Db 4848 GAATGTGAGCGGGGGCCCTATCACTAGAGAGGCCTCTAAAGAAATACCTGATTTCCTT — 4 905 

Qy 5170 CACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTA 5229 

I I I II I M I I I I I I I I 

Db 4906 AAAC AT C T AGAAACT GAAGACAAC AT T AAGGTGTGGTT 4 943 

Qy 5230 CAACAACAAGGGCTATCACAGCAT GCCCACCTACCT CAACAGC CT CAACAACGCCAT CCT 5289 

II II II I I I I I II III I I II I I I II I II I M I II I I I I 

Db 4944 TAATAACAAAGGCTGGCATGCCCTGGTCAGCTTTCTCAATGTGGCCCACAACGCCATCTT 5003 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



529 0 GCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAA 534 9 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I II I I 
5004 ACGGGCCAGCCTGCCTAAGGACAGGAG C C C C GAGGAGT AT G GAAT C ACC GT CAT TAG 5060 

535 0 CCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCAC 54 06 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

50 61 C CAAC C C C T GAAC CT GAC CAAGG AGC AGCT C T CAGAGAT T AC AGT GCT GAC C ACT T C AGT 5120 

54 07 GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGT 54 66 

I I I I I II I I I I I I I I III I I I I II I I I I I I I I I I I I I I I I I I I I 
5121 GGATGCTGTGGTTGCCATCTGTGTGATTTTCTCCATGTCCTTCGTCCCAGCCAGCTTTGT 518 0 

54 67 TGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTG 5526 

II I I III I I Ml I I I I I II I I I I I I I I I I II I I 

5181 C CT TT AT T T GAT C C AGGAGC G GGT GAAC AAAT C C AAGC AC CT CC AGT T TAT C AGT G GAGT 52 4 0 

5527 CAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCC 55 8 6 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II 
5241 GAG CC C C ACCAC C TACT G GGT GAC CAAC T T C CT CT GGGACAT C GT GAAT TAT T C C GT GAG 5300 

55 87 CGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCAC 5646 

III II I I I I I I I I I I I I I I I I I I I I I I I I 

5301 TGCTGGGCTGGTGGTGGGCATCTTCATCGGGTTTCAGAAGAAAGCCTACACTTCTCCAGA 5360 

5647 CAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCAT 57 06 

I I I I I I I I I I I I III I I I I I I I I I I I I I I I I III I I I I I I I 
5361 AAACCTTCCTGCCCTTGTGGCACTGCTCCTGCTGTATGGATGGGCGGTCATTCCCATGAT 5420 

57 07 GTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCAT 57 66 

II II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5421 GTACCCAGCATCCTTCCTGTTTGATGTCCCCAGCACAGCCTATGTGGCTTTATCTTGTGC 54 80 

57 67 CAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCA 5826 

I I I I I I I I I I I II I I I II I II I I I I I I I I I I I I I I I I I 

54 81 T AAT CT GT T CAT C G G CAT CAAC AG C AGT G CT AT T AC CTT CAT CT T GGAAT TAT T T GAGAA 5540 

5827 CGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAA 58 86 

II I III I I I I I I I I I I III I I I I I I I I 

5541 TAACCGGACGCTGCTCAGGTTCAACGCCGTGCTGAGGAAGCTGCTCATTGTCTTCCCCCA 5600 

58 87 CT ACAAC C T G G GC C AC GG G CT CAT GGAGAT G GC CT ACAAC GAGT ACAT CAAC GAGT ACT A 594 6 

III II I I I I I I I I I I I I I I I III I I I I II II III 
5601 CTTCTGCCTGGGCCGGGGCCTCATTGACCTTGCACTGAGCCAGGCTGTGACAGATGTCTA 5660 

594 7 CGCCAAGATTGGCCAGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCG 60 06 

III I I I I I II II II I I I I I I I I I I I I I I I 

5661 TGCCCGGTTTGGTGAGGAGCACTCTGCAAA TCCGTTCCACTGGGACCTGATTGGGAA 5717 

6007 CGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCA 6066 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II III 
5718 GAACCTGTTTGCCATGGTGGTGGAAGGGGTGGTGTACTTCCTCCTGACCCTGCTGGTCCA 5777 

6067 GTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCC TGTGGAGGA 6123 

I I I I I I I I I III I II MM I I I I I II 

5778 GCGCCACTTCTTCCTCTCCCAATGGATTGCCGAGCCCACTAAGGAGCCCATTGTTGATGA 5837 



6124 T GAT GT G G AC GT G G C CAGT GAGC G GC AGC GAGT GC T C C G G GGAGAC GC C GACAAT GAC AT 6183 

I I I I II I I I I I M I I I M I I III I I I I I I I I 
5838 AGAT GAT GAT GT GGC T GAAGAAAGAC AAAGAAT TAT T ACT GGT GGAAAT AAAAC T GAC AT 5897 

6184 GGTCAAGATTGAGAACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGC 6243 

I I I I I I II I I I I I I I I I II I I I I I I 

5898 CT T AAGG CT AC AT GAAC T AAC CAAGAT T TAT C C GG G C AC CTCCAGCCCAGC 5948 

6244 CGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAA 6303 

II Ml I I I I I I I II II II I I I I I I I I I I I I I II I I I I I I I I M II 
5949 AGTGGACAGGCTGTGTGTCGGAGTTCGCCCTGGAGAGTGCTTTGGCCTCCTGGGAGTGAA 6008 

6304 CGGTGCGGG C AAG AC C AG C AC C T T CAAGAT G C T GAC C G G C GAC GAG AG C AC GAC G G G G G G 6363 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I IN M 

6009 T GGT G C C G GCAAAACAAC C ACAT T CAAGAT G CT C ACT GG G GAC AAC ACAGT GAC CT C AG G 6068 

6364 CGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCT 6423 

I I I I I III II III I II I I I I I I I I I I I 

6069 G GAT G C C AC C GT AG C AG G C AAGAGT AT T T T AAC C AAT AT T T CT GAAGT C CAT C AAAAT AT 612 8 

6424 CGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCA 6483 

III I I I I I I I I I I I I I I I I I 

6129 GGGCT ACT GT CCT CAGT TT GAT GCAAT CGAT GAGCT GCT CACAGGACGAGAAC AT CTT TA 618 8 

64 84 GCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGC 6543 

I I I I I I I II I II I I I I Ml I I I I I I I I I I 

6189 C CT TT AT GCCCGGCTTC GAGGT GT AC C AG C AGAAGAAAT C GAAAAGGTT GCAAACT GGAG 6248 

6544 TCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGG 6603 

|| Ml I I I I I II I I I I I II I I I I II I I I I I I I I II I I I I I I 

624 9 TATTAAGAGCCTGGGCCTGACTGTCTACGCCGACTGCCTGGCTGGCACGTACAGTGGGGG 6308 

6604 CAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCT 6663 

II I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
6309 CAACAAGCGGAAACTCTCCACAGCCATCGCACTCATTGGCTGCCCACCGCTGGTGCTGCT 6368 

6664 GGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCT 6723 

M I I I I I I I II I I I I I I I I II I I I II I I I I II II I I II I I I I I I I I I II I 
6369 GGAT GAGC CC AC C ACAG GGAT GG AC C CC C AG G CAC GC C GC AT GCT GT G GAACGT CAT C GT 642 8 

672 4 C GAC C T CAT CAAG ACAGGGC GT T CAGT GGT GCT GACAT CAC ACAGC AT GGAGGAGT GC GA 67 8 3 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I M I I 

642 9 GAGC AT CAT C AGAGAAG G GAGG GCT GT G GT C C T CACAT C C CACAGCAT GGAAGAAT GT GA 64 8 8 

67 8 4 GGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCAT 684 3 

| | | | | || I II I I I I I II I II I I I I I I I I I I I I I M II I I I I I I I I I 
64 89 GGCACTGTGTACCCGGCTGGCCATCATGGTAAAGGGCGCCTTTCGATGTATGGGCACCAT 654 8 

6844 C CAGCACCT GAAGAACC GGTTT GGAGAT GGCTACATGAT CAC GGT GCGGAC CAAGAGCAG 6903 

I I I I I I I I I I I I II I I I I I I I I I II II MM II II I II I 
6549 T CAGCAT CT CAAGT C C AAATT T G GAGAT GG CT AT AT C GT C ACAAT GAAGAT C AAAT C C C C 6608 

6904 CCAGAGTG TGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCC 694 8 

M I MM I I I I II I I I II II I I II II I I II 

6609 GAAGGACGACCTGCTTCCTGACCTGAACCCTGTGGAGCAGTTCTTCCAGGGGAACTTCCC 6668 

694 9 G GAAG CC AT GCT C AAGGAG CG GC AC C AC AC AAAG GT GC AGT AC CAGCT CAAGT C G GAG CA 700 8 



Db 


6669 


AGGCAGTGTGCAGAGGGAGAGGCACTACAACATGCTCCAGTTCCAGGTCTCCTC 


6722 


Qy 


7009 


CATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGA 
i i i i i i i i i i ii iii i i i i i i 
1 1 1 1 1 II 1 1 1 1 1 1 1 1 II IN 1 1 1 1 M 
CTCCTCCCTGGCGAGGATCTTCCAGCTCCTCCTCTCCCACAAGGACAGCCTGCTCATCGA 


7068 


Db 


6723 


6782 


Qv 


7069 


G GAC TACT C G GT C AGC C AG AC C AC AC T G G AC AAT GT G T T C GT GAAC T T T G C C AAGAAG C A 


7128 




I I I I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6783 


GGAGTACTCAGTCACACAGACCACACTGGACCAGGTGTTTGTAAATTTTGCTAAACAGCA 


6842 


Qy 


7129 


GAGT GACAAC C T GGAGC 7145 




Db 


6843 


1 1 1 1 1 1 1 Ml 

GAC T GAAAGT CAT GAC C 6859 





RESULT 13 
ABN99317 

ID ABN99317 standard; cDNA; 9870 BP. 
XX 

AC ABN99317; 
XX 

DT 17-JAN-2003 (first entry) 
XX 

DE Polymorphic human ABCA1 transporter coding sequence #17. 
XX 

KW Human; ABCA1; transporter; ATP-binding cassette; 

KW high density lipoprotein; HDL; cholesterol; familial HDL deficiency; 

KW Tangier disease; myocardial infarction; atherosclerosis; 

KW cardiovascular disease; gene; single nucleotide polymorphsim; SNP; ss, 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 
FT CDS 314. .7099 

FT /*tag= a 

FT /product= "ABCAl transporter" 

FT /transl_except= (pos: 3677. . 3679, aa : Cys ) 

XX 

PN WO200236770-A2. 
XX 

PD 10-MAY-2002. 
XX 

PF 12-OCT-2001; 2001WO-FR003182 . 
XX 

PR 31-OCT-2000; 2000FR-00014037 . 
PR ll-DEC-2000; 2000US-0254108P . 
XX 

PA (AVET ) AVENTIS PHARMA SA. 

PA (INRM ) INSERM INST NAT SANTE & RECH MEDICALE. 
XX 

PI Denefle P, Rosier M, Arnould-Reguigne I, Duverger N, Cambien F; 
XX 

DR WPI; 2002-435691/46. 
DR P-PSDB; ABB83121. 
XX 

PT New polymorphisms in the human ABCAl gene, useful for diagnosing 



PT predisposition to myocardial infarct and other cardiovascular diseases. 
XX 

PS Claim 1; Page 170-173; 297pp; French. 
XX 

CC The present sequence is a polymorphic coding sequence for human ATP- 

CC binding cassette (ABCAl) transporter. This sequence can be used for 

CC diagnosing (predisposition to) diseases associated with the plasma level 

CC of high density lipoprotein (HDL) cholesterol, especially familial HDL 

CC deficiency conditions such as Tangier disease, myocardial infarction, 

CC atherosclerosis and other cardiovascular diseases. This sequence 

CC comprises mutation s-123e22, also given in ABN99266, and the alternative 

CC form of the polymorphism is shown in ABL58157 

XX 

SQ Sequence 9870 BP; 2670 A; 2220 C; 2340 G; 2639 T; 0 U; 1 Other; 

Query Match 12.3%; Score 988; DB 6; Length 9870; 

Best Local Similarity 52.8%; Pred. No. 8.6e-154; 

Matches 2855; Conservative 0; Mismatches 2300; Indels 257; Gaps 23; 

Qy 1745 TTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCATTGTC 18 04 

I I I I I I II I I II III II Ml Ml I I I I 

Db 1814 TT CAT GGAGTGTGTCAACCT GAACAAGCTAGAACCCAT AGCAACAGAAGTCT GGCT CAT C 1873 

Qy 1805 AAC T AC AC C C T C AAC C AG G C C T AC C AG G AC AAC G T C ACT GT T T T T G C C AGT GT GAT CT T C 1864 

I I I I I I I I I I I I I I I II 

Db 1874 AACAAGT C CAT GGAGCT GCT G GAT GAGAG GAAGT TCTGGGCT GGTAT T GT GT T CAC T GGA 1933 

Qy 18 65 CAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCC 1924 

| | I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1934 ATTACT C CAGGCAGCAT T GAGCT GCCCCATCAT GT CAAGTACAAGAT C CGAAT GGACAT T 1993 

Qy 1925 AGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACT 1984 

I I I I I I I I I I I I I I M I I I I MM 

Db 1994 GACAAT GT G GAGAG GACAAATAAAAT CAAGGAT GGGT ACTGGGACCCT GGT CCT CGAGCT 2053 

Qy 1985 GGCGGCCGCTTCTACTTCCTCTAC GGCTT C GT CT GGAT CC AGGAC AT GAT G 2035 

M I M I I Ml M II II I II I II I II II I I 

Db 2054 GACCCCTTTGAGGACATGCGGTACGTCTGGGGGGGCTTCGCCTACTTGCAGGATGTGGTG 2113 

Qy 2 036 GAGC GC GC CAT CAT C GAC ACT TT T GT GG GGCAC GAC GT GGT GGAG C C AG GCAGCTACGT G 2095 

| || | II I I I I I M I II I I M I M III Mill 
Db 2114 GAGCAGGCAATCAT C AG GGT GCT GAC G G G CAC C GAGAAGAAAAC T G GT GT C TAT AT G 2170 

Qy 2096 CAGAT GT T CC C CTACC C CT GCT ACAC ACGC GAT GACT T CCT GTT T GT CAT T GAGCACAT G 2155 

|| I I I I I I I I I II I II I II II I II I II I I I 

Db 2171 C AACAGAT G C C CT AT C CCT GT T AC GT T GAT GACAT CTTTCTGCGGGT GAT GAGC C GGT C A 2230 

Qy 2156 ATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATC 2215 

I | || | II I II II II II II I I II I II II II I II I II I I I I MM 
Db 2231 ATGCCCCTCTTCATGACGCTGGCCTGGATTTACTCAGTGGCTGTGATCATCAAGGGCATC 2290 

Qy 2216 G T G G C G G AG AAG GAG CAC C G G C T C AAG G AG GT GAT G AAG AC CAT G G G C C T G AAC AAC G C G 227 5 

Ml M II II I II II II I I I I I I Ml II II II II I I I I II I I I 
Db 22 91 GTGTATGAGAAGGAGGCAC GGCT GAAAGAGACCATGCGGAT CAT GGGCCTGGACAACAGC 2350 

Qy 227 6 GTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCA 2335 

I I II I I I II I I II I II I I I I I I M I M 



2351 ATCCTCTGGTTTAGCTGGTTCATTAGTAGCCTCATTCCTCTTCTTGTGAGCGCTGGCCTG 2410 

2336 CTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGG 2395 

|| I I I I I I I I I II I II I I I I I I I I I I II II 

2411 CTAGTGGTCATCCTGAAGTTAGGAAACCTGCTGCCCTACAGTGATCCCAGCGTGGTGTTT 2470 

2396 CTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTG 2455 

I I I I I I I I I I I I I I I I I I I I I I I I I I M 

2471 GTCTTCCTGTCCGTGTTTGCTGTGGTGACAATCCTGCAGTGCTTCCTGATTAGCACACTC 2530 

2456 TACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTG 2515 

I I I I I I I I I I I I I I I I II I I I I I MIM 

2531 TTCTCCAGAGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTG 2590 

2516 C CCT ACAT GT ACGT GGCGAT CCGAGAGGAGGT GGCGCAT GATAAGAT CACGGC CTTCGAG 2575 

I I I I I I III Ml II I 

2591 CCCTAC GTCCTGTGTGTGGCATGGCAGGACTACGTGGGCTTCACACTC 2638 

257 6 AAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCG 2635 

Ml | I I I I III I I I I I I I I I I I I I I II I I I I I I I I I I I I 
2639 AAGATCTTCGCTAGCCTGCTGTCTCCTGTGGCTTTTGGGTTTGGCTGTGAGTACTTTGCC 2698 

2636 CTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAG 2695 

II I Mill I I I I I I I I I I I I I I I I I I I II I I 

2699 CTTTTTGAGGAGCAGGGCATTGGAGTGCAGTGGGACAACCTGTTTGAGAGTCCTGTGGAG 2758 

2 696 GGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTAT 2755 

| | I I M I I I I I I I I I I I I I I I II I I I I I I I I I II I I I 

2759 GAAGAT G GC T T CAAT CT CAC CACT T C GGT CT C CAT GAT GCT GT T T GAC ACCTT C CT CT AT 2818 

2756 GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 2815 

|| | I I I I I 1 I I I I I I I I I ! I I 1 I MINI I I I I I I I I I I I I I I I 

2819 GGGGTGATGACCTGGTACATTGAGGCTGTCTTTCCAGGCCAGTACGGAATTCCCAGGCCC 2878 

2816 TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 2875 

| I I I I I I I I I I I I I I I I I I I I I M I I I 
2879 TGGTATTTTCCTTGCACCAAGTCCTACTGGTTTGGCGAGGAAAG 2922 

2 876 TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 2935 

I I I I I III I M 

2 923 T GAT GAGAAGAGCCACCCT GGT 2944 

2 936 GCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTG 2995 

Ml Ml | I II I I I I I I I I I I I I I II I I M I M I I 

2 945 T C C AAC C AGAAG AGAAT AT C AG A AAT C T G CAT G GAG GAG G AAC C CAC C CAC T T G 29 98 

2996 CCTCTGGTTGTCTGCGTG GAC AAACT CAC C AAG GT C T AC AAGGAC GAC AAG AAG C T GGC C 3055 
| | | | | | | I I I I I I I I I I I I I I I III I I I I I I I I I 

2 999 AAGCT G G G C GT GT CC AT T C AGAACC T G GT AAAAGT CT ACC GAGAT GGG AT GAAG GT G GCT 3058 

3 056 CTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAAC 3115 

| | | I I I I I I I I II Ml Mill II I II II II II I I I I M 

3 059 GTCGATGGCCTGGCACTGAATTTTTATGAGGGCCAGATCACCTCCTTCCTGGGCCACAAT 3118 

3116 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 3175 

|| | | | | | | | | I I I I I I II I I I II I II I I I I I II I I II II M II II Mill 
3119 GGAGCGGGGAAGACGACCACCATGTCAATCCTGACCGGGTTGTTCCCCCCGACCTCGGGC 317 8 



317 6 TCCGCCACCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAGAACCTG 3235 

I I I I M I I M M I I I I I I I I I I I I I I I I I I II I I I 

3179 ACCGCCTACATCCTGGGAAAAGACATTCGCTCTGAGATGAGCACCATCCGGCAGAACCTG 3238 

3236 GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 3295 

|| I I I I I II I I I I I I I M M II II I I I I I I Mill 

3239 GGGGTCTGTCCCCAGCATAACGTGCTGTTTGACATGCTGACTGTCGAAGAACACATCTGG 3298 

3296 TTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGAGATCCGCAGAGAGATGGACAAGATG 3355 

| | | | | Ml I I I I I I I I I I I I I I I I I I I I I Mill 

3299 TTCTATGCCCGCTTGAAAGGGCTCTCTGAGAAGCACGTGAAGGCGGAGATGGAGCAGATG 3358 

3356 ATCGAGGACCTGG AGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGT 3412 

| Ml || II I I I II I I I I I II I I I I 

3359 GCCCTGGATGTTGGTTTGCCATCAAGCAAGCTGAAAAGCAAAACAAGCCAGCTGTCAGGT 3418 

3413 GGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATC 3472 

| | | || I I I II II I II I II II I I I M I I IM 

3419 GGAATGCAGAGAAAGCTATCTGTGGCCTTGGCCTTTGTCGGGGGATCTAAGGTTGTCATT 347 8 

3473 CTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATC 3532 

Mill M IMM M II I II I I II I III I M Mill II I 

3479 CTGGATGAACCCACAGCTGGTGTGGACCCTTACTCCCGCAGGGGAATATGGGAGCTGCTG 3538 
3533 CTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGAC 3592 

I M | I III I I II I Ml I M I I MM II M II II I II I II I II 

3539 CTGAAATACCGACAAGGCCGCACCATTATTCTCTCTACACACCACATGGATGAAGCGGAC 3598 

3593 CTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCG 3652 

| | | || M II I II I M II II II I I M M M I M I I M II II II M I 

3599 GTCCTGGGGGACAGGATTGCCATCATCTCCCATGGGAAGCTGTGCTGTGTGGGCTCCTCC 3658 

3653 CTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCC 3712 

|| | | | | | II I I II I I M I I M M M I II I II I 

3659 CTGTTTCTGAAGAACCAGTTGGGAACAGGCTACTACCTGACCTTGGTCAAGAAAGATGTG 3718 

3713 GAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTG 3772 

| || I I I I II I II I I I 

37 19 G AATCCTCCCTCAGTTCCTGCAGAAACAGTAGTAGCACTGTGTCA 3763 

3773 AGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTG 3832 

| Mil II II I II M I M Ml 

3764 TACCTGAAAAAGGAGGACAGTGTTTCTCAGAGCAGTTCTGATGCTGGCCTGGGCAGCGAC 3823 

3833 CTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAG 38 92 

II I M I M 

3824 CATGAGAGTGACACGCTGACCATCGATGTCTCTGCTATCTCCAACCTCATCAGGAAGCAT 3883 

3893 GGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGC 3952 

I I I I I I I I I I M M I I 

3884 GTGTCTGAAGCCCGGCTGGTGGAAGACATAGGGCATGAGCTGACCTATGTGCTGCCATAT 3943 

3953 AGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGAT 4012 

I I II I II I I I II I I M I Ml M I 

3944 GAA— GCTGCTAAGGAGGGAGCCTTTGTGGAACTCTTTCATGAGATTGATGACCGGCTC 4000 



Qy 4013 CAGTCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGG 4072 

I I I I I I I I I I I I I I I I I I 

Db 4001 T C AG AC CT GG G CAT T T C T AGT TAT G G CAT CT C AG AGAC GAC C C T G GAAGAAAT AT T C C T C 4060 

Qy 4073 GCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTG 4132 

I I I I I I I I I I I I I I I I I I I II 

Db 40 61 AAG GT G GC C GAAGAGAGT G G G GT G GAT G C T GAGAC CT C AGAT G GT AC C T T GC C AG CAAGA 4120 

Qy 4133 ACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAG 4192 

I I I I I I I II II I I I I I I I I I I I I I 

Db 4121 CGAAACAGGCGGGCCTTCGGGGACAAGCAGAGCTGTCTTCGCCCGTTCACTGAAGATGAT 4180 

Qy 4193 GGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGAC 4252 

I I I I I I I I I I I I 

Db 4181 GCTGCTG AT C C AAAT GAT 4198 

Qy 4253 CCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGC 4312 

I I I I I I I II I II I I I I I I I I I I 

Db 4199 T CT GACAT AGACCCAGAAT CCAGAGAGACAGACTT GCT CAGTGGGAT GGAT GGCAAAGGG 4258 

Qy 4313 AGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAA 4372 

I I I I I I I I I I I I III II I I I I I I II II II 

Db 4259 TCCTACCAGGTGAAAGGCTGGAAACTTACACAGCAACAGTTTGTGGCCCTTTTGTGGAAG 4318 

Qy 4 373 CGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCC 4 432 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4319 AGACTGCTAATTGCCAGACGGAGTCGGAAAGGATTTTTTGCTCAGATTGTCTTGCCAGCT 437 8 

Qy 4433 TTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCC 4492 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 4 37 9 GTGTTTGTCTGCATTGCCCTTGTGTTCAGCCTGATCGTGCCACCCTTTGGCAAGTACCCC 4 438 

Qy 44 93 CCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATC 4 552 

I I I I II III I I I I I I I I I I I I I I 

Db 4439 AGC CT GGAACTT CAGCCCT GGAT GTACAACGAACAGTACACATTT GT CAGCAAT GAT GCT 4498 

Qy 4553 CCCTACGCC7VACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCC 4612 

III I I I I I I I 

Db 44 99 CCTGA GGACACGGGAACC 4516 

Qy 4 613 CAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAG 4 672 

I I I I I I I I I I II I I I I I I II I I I II 

Db 4517 CTGGAACTCTTAAACGCCCTCACCAAAGACCCTGGCTTCGGGACCCGCTGTATGGAAGGA 4576 

Qy 4 673 TCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTG 4732 

II I I I I I I I I I I I I I I I I I I I I I I I 

Db 4577 AAC C C AAT C C C AGACAC GCC CT G- - C C AG GC AGGGGAGGAAGAGT GGAC C ACT G C C C C AG 4634 

Qy 4733 CTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTG 4792 

I I I I I I I I I I I I I I I I I II 

Db 4 635 T T C C C C AG AC CAT CAT G GAC C T C T T C C AG AAT G G G AAC T G G AC AA 4 679 

Qy 47 93 TCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGAT 4 852 

III I I I I I II I I I I I I I I II 

Db 468 0 TGCAGAACCCTT CACCTGCATGCCAGT GTAGCAGCGACAAAATCAAGAAGAT GCT GCCTG 4739 

Qy 4853 GAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACG 4912 



Db 474 0 TGTGTCCCCCAGGGGCAGGGGGGCTGCCTCCTCCACAAAGAAAACAAAACACTGCAGATA 4799 

Qy 4 913 TCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAG 4972 

II II II I I I I I I I I I I I I I I I I 

Db 4800 T CCT T CAGGAC CT GAC AGGAAGAAAC AT T T C GGATT AT CT GGT GAAGACG- TAT GT GCAG 4858 

Qy 4973 GGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAG-ATGCGGGTGGT 5031 

I I I I II I I I I I I I I I I I II I I I 

Db 4 859 AT CAT AG C C AAAAG C T T AAAGAAC AAGAT CT GG GT GAAT GAGT T TAG GT AT GGCGGCTTT 4 918 

Qy 5032 C AC AG G C GAC AT CCT GAC C GAC AT C AC C G G C C AC AAT GT C T C T GAGT AC CTGCTCTT C AC 5091 

III II II I I I I III III III I 
Db 4919 TCCCTGGGT GT CAGTAAT ACT CAAGC ACT T C C T CCGAGT CAAGAAGT T AAT GAT GC 4974 

Qy 5092 CTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTC 5151 

I I I I I I II I I I I I I I I II 
Db 4975 CACCAAACAAATGAAGAAACACCTAAAGCT GGCCA AGGACAG 5016 

Qy 5152 CATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAG 5211 

III I I I I I I I I I I III II II 

Db 5017 T T CT G C AGAT C GAT T T CT C AAC AGC T T GG GAAGATT T AT GAC AGGAC T G G ACAC C AGAAA 507 6 

Qy 5212 G G C T G C C C AG G T T T T C T AC AAC AAC AAG G G C TAT C AC AG CAT G C C C AC C T AC C T C AAC AG 5271 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 

Db 5077 TAATGTCAAGGTGTGGTTCAATAACAAGGGCTGGCATGCAATCAGCTCTTTCCTGAATGT 5136 

Qy 5272 CCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTA 5331 

I I I I I I I I I I I I I I I 1 I I I I I II I I I I III I II I I I I I III 
Db 5137 CAT C AACAAT G C CAT TCTCCGGGC CAAC CT G CAAAAGGGAGAG AAC C C TAG C CAT T A 5193 

Qy 5332 C GG CAT C AC CGT C AC CAAC C AC C C CAT GAAT AAGAC CAGC GC C AG CCTCTCCCT GGATT A 5391 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 5194 T GGAATT AC T GCT TT CAAT CAT CC C CT GAAT C T CAC CAAG C AGCAGCT CT CAGAG GT GGC 5253 

Qy 5392 CCTGCTGCAGGGCAC GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTT 5448 

I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I 

Db 5254 TCCGATGACCACATCAGTGGATGTCCTTGTGTCCATCTGTGTCATCTTTGCAATGTCCTT 5313 

Qy 5449 CGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCT 5508 

I I I I I I I I II I I I I I I I I I I I I I III I I I I I I II I I I I I I 

Db 5314 CGTCCCAGCCAGCTTTGTCGTATTCCTGATCCAGGAGCGGGTCAGCAAAGCAAAACACCT 5373 

Qy 5509 GCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACAT 5568 

I I I I I I I I I I II II I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I 

Db 5374 GCAGTTCATCAGTGGAGTGAAGCCTGTCATCTACTGGCTCTCTAATTTTGTCTGGGATAT 5433 

Qy 5569 GCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCC 5628 

I I I I I I I I I I I I I I I II I I II I II I I I I I I I I 

Db 5434 GTGCAATTACGTTGTCCCTGCCACACTGGTCATTATCATCTTCATCTGCTTCCAGCAGAA 5493 

Qy 5629 GGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTG 5688 

I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5494 GTCCTATGTGTCCTCCACCAATCTGCCTGTGCTAGCCCTTCTACTTTTGCTGTATGGGTG 5553 

Qy 5689 GTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTA 5748 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 



5554 GTCAATCACACCTCTCATGTACCCAGCCTCCTTTGTGTTCAAGATCCCCAGCACAGCCTA 5613 

574 9 C GT GTT C CT CATT GT CAT CAAT CT CT T CAT C GGCAT CAC C GC CAC CGTGGC CAC CTT C CT 58 08 

IN I I I I I I I I I I I I I I I I I | I I I I I I | | M I I I I I I 

5614 TGTGGTGCTCACCAGCGTGAACCTCTTCATTGGCATTAATGGCAGCGTGGCCACCTTTGT 5673 

58 09 GCT ACAGCT CTT CGAGCAC GACAAGGAC CTGAAGGTT GT CAACAGTT ACCTGAAAAGCT G 5868 

M I I I I I I I I I I I I I I I I I I I I I | | | | | M I I II I 

5674 GCTGGAGCTGTTC AC C GACAAT AAG CT GAAT AAT AT CAAT GAT AT C C T GAAGT C C GT 5730 

5869 CTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGA 5928 

IN I M Mill II I I I I I I I II Illlll I III I 

5731 GTTCTTGATCTTCCCACATTTTTGCCTGGGACGAGGGCTCATCGACATGGTGAAAAACCA 57 90 

5929 GT AC AT C AAC G AGT ACT AC G C C AAGAT T GG C C AGT T T GAC AAGAT GAAGT CCCCGTTC GA 5988 

I I I II I I I I I I I I I I I I I I I I I I I I 
5791 GGCAATGGCTGATGCCCTGGAAAGGTTTGGGGAGAATCGCTTTGT G T CAC CAT TAT C 5847 

5989 GTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCT 604 8 

I M I I I I I I II I I I I I I I I I I II I I | | | IIIMI 

58 4 8 TTGGGACTTGGTGGGACGAAACCTCTTCGCCATGGCCGTGGAAGGGGTGGTGTTCTTCCT 5907 

6049 CCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTAC 6108 

I I I I I M I I I I I I I I I I I I I I I I | | || 

5908 CAT TACT GT T CT GAT C C AGT AC AGAT T C T T CAT CAG GC CC AGACCT GT AAAT G CAAAGC T 5967 

6109 CAAGCCTGTG— GAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGG 6165 

Ml III I III II I II I I 

5968 AT C T C C T C T GAAT GAT G AAG AT G AAG AT G T GAG G C G G G AAAG AC AG AG AAT T C T T GAT G G 6027 

6166 AGAC G C C GACAAT GAC AT G GT C AAG AT T G AGAAC C T GAC C AAG GT CT AC AAGT C C C G G AA 6225 

I I I I I I I I M II I III Ml I I I I M I | M | 
6028 T GGAGGC CAGAAT GAC AT CTT AGAAAT C AAG GAGT T GAC GAAGAT AT A TAG 6078 

622 6 GATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTT 62 85 

I M I I I I I I I I I I I I I I I I I I I I I I I I | M | | | | | | | | 

6079 AAGGAAGCGGAAGCCTGCTGTTGACAGGATTTGCGTGGGCATTCCTCCTGGTGAGTGCTT 613 8 

6286 CGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGA 634 5 

I M M I I I I I I I I I I I | | M || | || || 

6139 TGGGCTCCT G GGAGT T AAT G G G G CT G GAAAAT CAT C AACT T T CAAGAT GT T AACAGGAGA 6198 

634 6 CGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCT 6405 

I M I I I I I I I I II I I I I I I II I I | || 

6199 T AC C ACT GT T AC CAGAGGAGAT GCTTTCCT T AACAGAAAT AGT AT CTT AT C AAAC AT C C A 6258 

64 06 CCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCAC 64 65 

I I I I I I I I I I I I II I I I I I II I I I I I I II I I I | I | | | | 

6259 T G AAG T AC AT CAG AAC AT G G G C T AC T G C C C T C AGT T T GAT G C CAT CAC AG AG C T G T T GAC 6318 

64 66 GGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGC 6525 

I I I I I M M I I I I M I I I I I I I I I 

6319 T G GGAGAGAACAC GT GGAGT TCTTTGCCCTTTT GAGAG GAGT C C C AGAGAAAGAAGT T GG 6378 

6526 CCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGC 6585 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I M II 

637 9 CAAGGTTGGTGAGTGGGCGATTCGGAAACTGGGCCTCGTGAAGTATGGAGAAAAATATGC 6438 



Qy 6586 TGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTA 6645 

III I III II I I II I I I I I I II I I I I I I II II I I I II I I I II || 
Db 64 39 TGGTAACTATAGTGGAGGCAACAAACGCAAGCTCTCTACAGCCATGGCTTTGATCGGCGG 64 98 

Qy 664 6 CCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTT 67 05 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6499 GCCTCCTGTGGTGTTTCTGGATGAACCCACCACAGGCATGGATCCCAAAGCCCGGCGGTT 6558 

Qy 67 06 CCT CT GGAAC CT CAT C CT C GAC CT CAT CAAGACAGGGCGT T CAGT GGT GCT GACAT CACA 6765 

I I I I I II III I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 6559 CT T GT GGAATTGTGC C CTAAGT GTT GT CAAGGAGGGGAGAT CAGTAGT GCT T ACAT CT CA 6618 

Qy 6766 CAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCT 6825 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 6619 TAG TAT GGAAGAAT GT GAAG CT CT T T G C ACT AG GAT G GCAAT CAT GGT CAAT G GAAGGT T 6678 

Qy 682 6 GCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTACATGATCAC 6885 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6679 CAGGTGCCTTGGCAGTGTCCAGCATCTAAAAAATAGGTTTGGAGATGGTTATACAATAGT 6738 

Qy 6886 GGTGCGGA CCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAA 6942 

I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 6739 T GT AC GAAT AGC AGGGT C CAAC C C GGAC CT GAAGC CT GT CC AGGATT T CTT T G GACT T G C 67 98 

Qy 6943 CTT C CC GGAAGC CAT G CT CAAG GAGC GGC AC C ACAC AAAGGT GCAGT AC CAGCT CAAGT C 7002 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 67 99 ATTT CCT GGAAGT GTT CCAAAAGAGAAACAC C GGAACAT GCT ACAAT AC CAGCTT C CAT C 6858 

Qy 7 0 03 GGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGG 7062 

I I I I I I I I I I I I I I I II I III II 

Db 6859 T T CAT TAT CTTCTCTGGC C AGGAT AT T C AG CAT CCT CT C CC AGAG CAAAAAG C GAC T C C A 6918 

Qy 7 063 CATCGAGGACTACT CGGTCAGCCAGACCACACT GGACAATGTGTT CGTGAACTTT GCCAA 7122 

III II I I I I I I I I II I I I II I I I I I III I II II I I I I I I I I I I I I I I 

Db 6919 CAT AGAAGACT ACT CT GT TT CT C AGACAAC AC T T GAC CAAGT AT T T GT GAACT T T GC C AA 6978 

Qy 7123 GAAGCAGAGTGA 7134 

I I II Mill 
Db 6979 GGAC CAAAGT GA 6990 



RESULT 14 
ABN99311 

ID ABN99311 standard; cDNA; 9870 BP. 
XX 

AC ABN99311; 
XX 

DT 17-JAN-2003 (first entry) 
XX 

DE Polymorphic human ABCA1 transporter coding sequence #11. 
XX 

KW Human; ABCA1; transporter; ATP-binding cassette; 

KW high density lipoprotein; HDL; cholesterol; familial HDL deficiency; 

KW Tangier disease; myocardial infarction; atherosclerosis; 

KW cardiovascular disease; gene; single nucleotide polymorphsim; SNP; ss. 

XX 



OS Homo sapiens. 
XX 

FH Key Location/Qualif iers 

FT CDS 314. .7099 

FT /*tag= a 

FT /product= "ABCA1 transporter" 
XX 

PN WO200236770-A2. 
XX 

PD 10-MAY-2002. 
XX 

PF 12-OCT-2001; 2001WO-FR003182 . 
XX 

PR 31-OCT-2000; 2000FR-00014037 . 

PR ll-DEC-2000; 2000US-0254108P . 
XX 

PA (AVET ) AVENTIS PHARMA SA. 

PA (INRM ) INSERM INST NAT SANTE & RECH MEDICALE. 
XX 

PI Denefle P, Rosier M, Arnould-Reguigne I, Duverger N, Cambien F; 
XX 

DR WPI; 2002-435691/46. 

DR P-PSDB; ABB83116. 
XX 

PT New polymorphisms in the human ABCA1 gene, useful for diagnosing 

PT predisposition to myocardial infarct and other cardiovascular diseases. 

XX 

PS Claim 1; Page 155-158; 297pp; French. 
XX 

CC The present sequence is a polymorphic coding sequence for human ATP- 

CC binding cassette (ABCA1) transporter. This sequence can be used for 

CC diagnosing (predisposition to) diseases associated with the plasma level 

CC of high density lipoprotein (HDL) cholesterol, especially familial HDL 

CC deficiency conditions such as Tangier disease, myocardial infarction, 

CC atherosclerosis and other cardiovascular diseases. This sequence 

CC comprises mutation s-196el5, also given in ABN99256, and the alternative 

CC form of the polymorphism is shown in ABL58154 

XX 

SQ Sequence 9870 BP; 2671 A; 2221 C; 2339 G; 2638 T; 0 U; 1 Other; 

Query Match 12.3%; Score 988; DB 6; Length 9870; 
Best Local Similarity 52.8%; Pred. No. 8.6e-154; 

Matches 2855; Conservative 0; Mismatches 2300; Indels 257; Gaps 23; 



Qy 174 5 T T CAT GT C C AAG GT GAG C GT GGACAT CT T CAAGGGCT T C C C C GAC GAGGAGAG CAT T GT C 1804 

II II I I I I I I II I I I II III III I I I I 

Db 1814 TT C AT G GAGT GT GT CAAC CT GAACAAGC T AGAAC C CAT AG CAAC AGAAGT CT G GCT CAT C 1873 

Qy 18 05 AACT AC AC C CT CAAC CAGG C CT AC C AGGAC AAC GT CAC T GT T T T T GC C AGT GT GAT CT T C 1864 

III I II I I I I III I I I I III II 

Db 187 4 AAC AAGT C CAT G GAGCT GC T G GAT GAGAGGAAGT T C T GGGCT G GT ATT GT GT T C ACT G G A 1933 

Qy 1865 C AGAC C C G GAAGGAC GGCT C G CT C CC GC CT C AC GT GC ACT ACAAGAT C C G C CAGAACT C C 1924 

Ml I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1934 ATTACT C CAGGCAGCATT GAGCT GCC CC AT CAT GT CAAGTACAAGAT CCGAAT GGACAT T 1993 



Qy 



1925 AGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACT 1984 



Db 1994 GACAAT GT G GAGAGGACAAATAAAAT C AAGGAT GG GT ACT GGGAC CCTGGTCCTC GAG CT 2053 

Qy 1985 GGCGGCCGCTTCTACTTCCTCTAC GGCTT C GT CT GGAT CCAGGACAT GAT G 2035 

II I I I I I III I I I I I I I I I I I I I I I I I I I 

Db 2 054 GACCCCTTTGAGGACATGCGGTACGTCTGGGGGGGCTTCGCCTACTTGCAGGATGTGGTG 2113 

Qy 2 036 GAGC G C G C CAT CAT C GACACT T T T GT GG G GC AC GAC GT GGT GGAG C C AG GC AG C T AC GT G 2095 

I I I I I I II I I I II I II I I III II IN III || 

Db 2114 GAGCAGGCAATCAT CAGGGT GCT GAC GGGCACCGAGAAGAAAACT GGT GT CTATAT G 2170 

Qy 2096 CAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATG 2155 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2171 CAACAGAT GC C CT AT CC CT GT T AC GT T GAT GAC AT CTTTCTGCGGGT GAT GAG C C GGT C A 2230 

Qy 2156 ATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATC 2215 

I Ml II I I I I I I I II I I I I I II I I I 1 I I I I I I I I I 

Db 2231 ATGCCCCTCTTCATGACGCTGGCCTGGATTTACTCAGTGGCTGTGATCATCAAGGGCATC 2290 

Qy 2216 GT G GC GGAGAAGGAG CACC GGCT CAAG GAGGT GAT GAAGAC CAT G G G C CT GAACAAC GC G 2275 

I II I I I I I I I I I I I II I I I I I I III II I I I I I I I I I I I I I I I 

Db 2291 GT GTAT GAGAAGGAGGCAC GGCT GAAAGAGAC CATGCGGAT CAT GGGCCT GGACAACAGC 2350 

Qy 227 6 GTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCA 2335 

I I I I I I I I I I I I I I I I I III II II I II 

Db 2 351 ATCCTCTGGTTTAGCTGGTTCATTAGTAGCCTCATTCCTCTTCTTGTGAGCGCTGGCCTG 2410 

Qy 2336 CTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGG 2395 

II I I I I I I I I I I I I II I I I II I I I I I II II 

Db 2411 CTAGTGGTCATCCTGAAGTTAGGAAACCTGCTGCCCTACAGTGATCCCAGCGTGGTGTTT 247 0 

Qy 2396 CTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTG 2455 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 2471 GTCTTCCTGTCCGTGTTTGCTGTGGTGACAATCCTGCAGTGCTTCCTGATTAGCACACTC 2530 

Qy 2456 TACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTG 2515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2531 TTCTCCAGAGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTG 2590 

Qy 2516 C C C T ACAT GT ACGT G GC GAT C C G AGAGGAGGT GGC GCAT GAT AAGAT C AC G GC CT T C GAG 2575 

I I I I I I III III I I I I I I I I I 

Db 2591 CCCTAC GTCCTGTGTGTGGCATGGCAGGACTACATGGGCTTCACACTC 2 638 

Qy 2 57 6 AAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCG 2635 

III I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 2639 AAGATCTTCGCTAGCCTGCTGTCTCCTGTGGCTTTTGGGTTTGGCTGTGAGTACTTTGCC 2698 

Qy 2636 CTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAG 2695 

II I lllll I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 2 69 9 C T T TT T GAGGAGC AG GGC AT T G GAGT GC AGT G GGACAAC C T GT T T G AGAGT C C T GT G GAG 2758 

Qy 2 69 6 GGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTAT 2755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I lllll 

Db 2759 GAAGAT GGCT T CAAT CT CAC CACT T C GGT CTC CAT GAT GCTGTTTGACACCTTCCTC TAT 2818 

Qy 2756 GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 2815 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2 819 GGGGTGATGACCTGGTACATTGAGGCTGTCTTTCCAGGCCAGTACGGAATTCCCAGGCCC 2 878 

Qy 2 816 TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 2 875 

I I I I I I I I I I I I I I I I I I I I I i I I I I I 
Db 2 87 9 TGGTATTTTCCTTGCACCAAGTCCTACTGGTTTGGCGAGGAAAG 2 922 

Qy 2876 TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 2 935 

I I I I I III I II 

Db 2923 T GAT GAGAAGAGC CAC C CT G GT 2944 

Qy 2 93 6 GCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTG 2995 

III III I I II I I I I I I I I I I I II I I I I I I I I I I I 

Db 2945 T C C AAC C AG AAGAGAAT AT C AGA AAT CT GC AT GGAGGAGGAAC C CAC C C ACT T G 2998 

Qy 2 99 6 CCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCC 3055 

I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

Db 2 99 9 AAGCT GGGCGTGTC CAT T CAGAAC C T GGT AAAAGT CT AC C GAGAT G G GAT GAAG GT G G C T 3 058 

Qy 3056 CT GAACAAGCT GAGC CT GAAC CT C T ACGAGAAC CAGGT GGTCTCCTTCTTG GGCC ACAAC 3115 

I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3059 GTCGATGGCCTGGCACTGAATTTTTATGAGGGCCAGATCACCTCCTTCCTGGGCCACAAT 3118 

Qy 3116 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 3175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3119 GGAGCGGGGAAGACGACCACCATGTCAATCCTGACCGGGTTGTTCCCCCCGACCTCGGGC 3178 

Qy 317 6 T CC GCCACCATCTACGGGCACGACAT CC GCAC GGAGAT GGAT GAGAT CCGCAAGAAC CT G 3235 

I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 3179 AC C G C CT AC AT C CT GGGAAAAGACAT T C GC T C T GAGAT GAG CAC CAT C C GGCAGAAC CT G 3238 

Qy 3236 GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 3295 

II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 3239 GGGGTCTGTCCC CAGC AT AAC GT G C T GT T T G ACAT GCT GAC T GT C GAAGAACACAT CT GG 3298 

Qy 32 9 6 TT CTACT CAC GGCT CAAGAGCAT GGCT CAGGAGGAGAT C CGCAGAGAGAT GGACAAGATG 3355 

I I I I I III III I I I I I I I I I I I I I I I I I I I I I I I 

Db 32 99 T T CT AT GCCCGCTT GAAAGGG C T CT CT GAGAAG CAC GT GAAGGC GGAGAT G GAG C AGAT G 3358 

Qy 335 6 AT C GAGGAC C T G G AGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGT 3412 

I III II II I I I I I I I I I I I I I I I I 

Db 3359 GCCCTGGATGTTGGTTTGCCATCAAGCAAGCTGAAAAGCAAAACAAGCCAGCTGTCAGGT 3418 

Qy 3413 GGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATC 3472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3419 GGAATGCAGAGAAAGCTATCTGTGGCCTTGGCCTTTGTCGGGGGATCTAAGGTTGTCATT 3478 

Qy 3473 CTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATC 3532 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 347 9 CTGGATGAACCCACAGCTGGTGTGGACCCTTACTCCCGCAGGGGAATATGGGAGCTGCTG 3538 

Qy 3533 CT GAAGT ACAAGCCAGGC C GCAC CAT CCT T CT GT C CAC C CACCACAT GGAT GAGGCT GAC 3592 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 
3539 CT GAAAT AC C GAC AAG G C C GCAC CAT T ATT CT CT C T AC AC AC CAC AT GGAT GAAG C GGAC 3598 

35 93 CTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCG 3652 

I II I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I 

3599 GTCCTGGGGGACAGGATTGCCATCATCTCCCATGGGAAGCTGTGCTGTGTGGGCTCCTCC 3658 



Qy 

Db 



Qy 3653 CTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCC 3712 

II II II III I II I I I I I I I I I I I I I I I I I I I 

Db 3659 CTGTTTCTGAAGAACCAGCTGGGAACAGGCTACTACCTGACCTTGGTCAAGAAAGATGTG 3718 

Qy 3713 GAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTG 3772 

I II I I I I I I I I I I I I 

Db 3719 G AAT C CT C C C T C AGT T C C T G C AGAAAC AG T AGT AG C AC T G T GT C A 3763 

Qy 3773 AGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTG 3832 

I III I II II III II III III 

Db 3764 TACCTGAAAAAGGAGGACAGTGTTTCTCAGAGCAGTTCTGATGCTGGCCTGGGCAGCGAC 3823 

Qy 38 33 CTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAG 3892 

II I I I II II II I I I I I I I I I I 

Db 382 4 CAT GAGAGT GACAC G CT GACC AT C G AT GT CT CT G C TAT C T C CAACCT CAT C AGGAAG CAT 38 83 

Qy 3893 GGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGC 3952 

I I I I I II II I I II I I II III I I I I 

Db 38 8 4 GTGTCTGAAGCCCGGCTGGTGGAAGACATAGGGCATGAGCTGACCTATGTGCTGCCATAT 3943 

Qy 3953 AGCT T C GG G CT GAT G GACAC GAC C CT GGAGGAAGT GT T C C T CAAGGT GT C GGAGG AGGAT 4 012 

I I I I I I I I I I I I I I I I I III II I 

Db 3944 GAA GC T GCTAAG GAGG GAGC CTT T GT GGAACT CT T T CAT GAGAT T GAT GAC C G G CT C 4000 

Qy 4 013 CAGTCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGG 4072 

I I I I I I I I I I I I I I II I I 

Db 4 001 T C AGAC CT GGGC AT T T CT AGT TAT GG C AT CT C AGAGAC GAC C CT GGAAGAAAT AT T C C T C 4060 

Qy 4 073 GCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTG 4132 

I I I I I I I II I I I I I I I I I I II 

Db 4061 AAG GT G G C CGAAGAGAGT GGGGT G GAT G CT GAGAC CT CAGAT GGTAC CT T G CCAG C AAGA 4120 

Qy 4133 ACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAG 4192 

I I I I I I I II II I I I I I I I I I I I I I 

Db 4121 CGAAACAGGCGGGCCTTCGGGGACAAGCAGAGCTGTCTTCGCCCGTTCACTGAAGATGAT 418 0 

Qy 4193 GGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGAC 4252 

I I I I I I I I I I II 

Db 4181 GCTGCTG AT C C AAAT GAT 4198 

Qy 4253 CCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGC 4312 

I I I I I I I II I II II II III I II 

Db 4199 TCTGACATAGACCCAGAATCCAGAGAGACAGACTTGCTCAGTGGGAT GGAT GGCAAAGGG 4258 

Qy 4313 AGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAA 4372 

I I II II I III II III II I I I I I I II II II 

Db 4259 TCCTACCAGGTGAAAGGCTGGAAACTTACACAGCAACAGTTTGTGGCCCTTTTGTGGAAG 4318 

Qy 4373 CGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCC 4432 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4319 AGAC T GCTAATT G C C AG AC G GAGT C GGAAAGGAT T T T T T G CT CAGAT T GT CTT GC CAGCT 437 8 

Qy 4 4 33 TTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCC 44 92 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I III 

Db 4 37 9 GTGTTTGTCTGCATTGCCCTTGTGTTCAGCCTGATCGTGCCACCCTTTGGCAAGTACCCC 4438 



Qy 44 93 CCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATC 4552 

I I I I I I III I I I I II I I I I I I I I 

Db 443 9 AGCCT GGAACT T CAGC C CT GGAT GT ACAACGAAC AGTACACAT TT GT CAGCAAT GAT GCT 44 9 8 

Qy 4553 CCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCC 4612 

III I I I I I I I 

Db 4 4 99 CCTGA GGACACGGGAACC 4516 

Qy 4 613 CAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAG 4 672 

I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4517 CTGGAACTCTTAAACGCCCTCACCAAAGACCCTGGCTTCGGGACCCGCTGTATGGAAGGA 4 57 6 

Qy 4 673 TCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTG 4732 

II I I I I I I I I I I I I I I I I I I I I I I I 

Db 457 7 AACCCAATCCCAGACACGCCCTG — C C AG GCAG G GGAG GAAGAGT G GAC CACT GC CC C AG 4 634 

Qy 47 33 CTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTG 47 92 

I I I I I I I I I I I I I I I I I II 

Db 4 635 T T C C C C AG AC CAT CAT GGAC C T C T T C C AGAAT G G GAAC T G GAC AA 4 67 9 

Qy 4 7 93 TCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGAT 4 852 

III I I I I I II I I I I I I I I II 

Db 4680 T GC AGAAC C CT T CAC CT G CAT GC C AGT GT AG CAGC GACAAAAT C AAGAAGAT GCTGCCTG 4739 

Qy 48 53 GAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACG 4912 

I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 474 0 TGTGTCCCCCAGGGGCAGGGGGGCTGCCTCCTCCACAAAGAAAACAAAACACTGCAGATA 4799 

Qy 4913 TCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAG 4 972 

II II II I I I I I I I I I I I I I I I I 

Db 48 0 0 T C CTT CAGGAC CTGAC AGGAAGAAACAT TT C GGAT TAT CT GGT GAAGACG- T AT GT GCAG 4 858 

Qy 4 97 3 GGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAG-ATGCGGGTGGT 5031 

I I I I I I III I I I I I I I I I I I I I 

Db 4859 AT C AT AGC CAAAAG CT T AAAGAACAAGAT CT GGGT GAAT GAGT TT AGGT AT GGC GGC T T T 4 918 

Qy 5032 C AC AGGC GACAT CCT GAC C GAC AT CAC C GG C CAC AAT GT CT CT GAGT AC CT G CT C TT C AC 5091 

III II II I I I I III III III I 
Db 4919 TCCCTGGGTGT C AGT AAT ACT C AAGCACT T C CT C CGAGT CAAGAAGT TAAT GAT GC 4974 

Qy 5092 CTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTC 5151 

I I I I I I I I I I I I I I I I II 
Db 4975 CAC CAAACAAAT GAAGAAAC AC CT AAAG CT G GC C A AGGACAG 5016 

Qy 5152 CATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAG 5211 

III MM II III I III II M 

Db 5017 TT CTGCAGATCGATTT CT CAACAGCTTGGGAAGATTTATGACAGGACTGGACACCAGAAA 507 6 

Qy 5212 GGCT G C C C AGGT T T T CT AC AAC AACAAG GGC TAT CAC AGC AT G C C CAC C T AC CT C AAC AG 5271 

I I I I I I I I I I I I I I II II I I I I II M I I I I I I I I 

Db 5077 T AAT GTCAAGGTGTGGTTC AAT AACAAGGGCTGGCATGC AAT CAGCTCTTT CCT GAAT GT 5136 

Qy 52 72 CCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTA 5331 

I I I I I I II I I I II I I I I I I I I II I I I I I I I I II I I I I I I I I 

Db 5137 CAT CAACAAT GC C AT TCTCCGGGC C AAC CT G CAAAAGG GAGAG AACCCTAGCCATTA 5193 



Qy 



5332 CGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTA 5391 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



1 1 I I II I l 1 1 l l 1 1 I I I 1 1 l 1 1 M I 1 1 I I ll 

5194 TGGAATTACTGCTTTCAATCATCCCCTGAATCTCACCAAGCAGCAGCTCTCAGAGGTGGC 



5253 



5392 CCTGCTGCAGGGCAC GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTT 544 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

5254 TCCGATGACCACATCAGTGGATGTCCTTGTGTCCATCTGTGTCATCTTTGCAATGTCCTT 5313 

54 4 9 CGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCT 5508 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

5314 C GT C C C AG C C AGC T T T GT C GT ATT C C T GAT C C AGGAGC G G GT CAG C AAAGCAAAAC AC CT 5373 

5509 GCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACAT 5568 

I I I I II I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I 

5374 GCAGTTCATCAGTGGAGTGAAGCCTGTCATCTACTGGCTCTCTAATTTTGTCTGGGATAT 5433 

5569 GCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCC 562 8 

I I I I I I I I I II I I I I I I I I II II I I I I 

5434 GT G CAAT T AC GT TGTCCCTGC C ACACT GGT CAT TAT CAT C T T CAT CT GCTT CC AGC AGAA 54 93 

562 9 GGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTG 568 8 

I I I I I III I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
54 94 GTCCTATGTGTCCTCCACCAATCTGCCTGTGCTAGCCCTTCTACTTTTGCTGTATGGGTG 5553 

5689 GTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTA 5748 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5554 GT CAAT C ACACCT C T CAT GTAC CCAGC C TCCTTTGTGTT CAAGAT CC CC AGCAC AG C CT A 5613 

5749 CGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCT 58 08 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

5614 TGTGGTGCTCACCAGCGTGAACCTCTTCATTGGCATTAATGGCAGCGTGGCCACCTTTGT 5673 

5809 GCTACAGCT CTT C GAGCACGACAAGGAC CT GAAGGT T GT CAACAGTT ACCT GAAAAGCT G 58 68 

III I I I I I I I I I I I I I II I I I I I I I I I I I I 

5674 GCTGGAGCTGTTC AC C GAC AAT AAGCT GAAT AAT AT CAAT GAT AT C CT GAAGT C C GT 5730 

5869 CT T C CT CAT T T T C C C C AACT AC AAC CT G GGC C AC G GG C T CAT GGAGAT GG C C T AC AAC G A 5928 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I II I 

5731 GTTCTTGATCTTCCCACATTTTTGCCTGGGACGAGGGCTCATCGACATGGTGAAAAACCA 5790 

592 9 GTAC AT CAAC GAGT ACT AC GC CAAGAT T GGC C AGT T T GACAAGAT GAAGT C C C C GT T C GA 5988 

I II II I I I I I I I I I I I I I I I I I I I I 
5791 GGCAATGGCTGATGCCCTGGAAAGGTTTGGGGAGAATCGCTTTGT GT C AC CAT TAT C 5847 

598 9 GTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCT 604 8 

I M I I I I I I II II I I I I I I I I I II I I I I I I I I I I II I I I 

5848 TTGGGACTTGGTGGGACGAAACCTCTTCGCCATGGCCGTGGAAGGGGTGGTGTTCTTCCT 5907 

604 9 CCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTAC 6108 

I I I I I II I I I I I I I I I I I I I I I I I I M 

5908 CAT T AC T G T T CT GAT C C AGT AC AG AT T C T T CAT CAG G C C CAG AC C T GT AAAT G C AAAG C T 5967 

6109 CAAGCCTGTG GAG GAT GAT GT G GAC GT GGC CAGT GAGC G G C AGC GAGT GCTCCGGGG 6165 

I II I I I I I I I I I I I I I I I III M M II 

5968 AT CT C C T CT GAAT GAT GAAGAT GAAGAT GT GAG GC GG GAAAGAC AG AGAAT T C T T GAT G G 6027 

6166 AG AC G C C GAC AAT GAC AT GGT CAAGAT T GAGAAC C T GAC C AAG GT CT AC AAGT C C C G G AA 6225 
I I I I I I I I I I I I I III M I I I I I I I I I I I I 



Db 602 8 T G GAG G C C AG AAT GAC AT C T T AGAAAT C AAG GAGT T GAC GAAGAT AT A TAG 607 8 

Qy 622 6 GATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTT 6285 

I M I I I I I II II I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 607 9 AAGGAAGCGGAAGCCTGCTGTTGACAGGATTTGCGTGGGCATTCCTCCTGGTGAGTGCTT 6138 

Qy 6286 CGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGA 6345 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6139 TGGGCTCCTGGGAGTTAATGGGGCTGGAAAATCATCAACTTTCAAGATGTTAACAGGAGA 6198 

Qy 6346 CGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCT 6405 

I II I I I I I I I I I I I II I I I II I I I II 

Db 6199 T AC C ACT GT T AC C AGAG GAGAT GCTTTCCT T AACAGAAAT AGT AT CT T AT CAAAC AT C CA 6258 

Qy 6406 CCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCAC 6465 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I 

Db 6259 T GAAGT AC AT C AGAAC AT GG GCT ACT GC C CT C AGT T T GAT G C CAT CAC AGAGC T GT T GAC 6318 

Qy 6466 GGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGC 6525 

I I I I I I I I I I I I I II I I I I I Ml I I I I I I I 

Db 6319 T GG GAGAGAAC AC GT GGAGT TCTTTGCCCTTTT GAGAGGAGT C C C AGAGAAAGAAGT T GG 6378 

Qy 652 6 CCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGC 658 5 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 

Db 6379 CAAGGTTGGT GAGT GGGCGATTCGGAAACTGGGCCTCGT GAAGT AT GGAGAAAAAT AT GC 6438 

Qy 6586 TGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTA 6645 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 6439 TGGTAACTATAGTGGAGGCAACAAACGCAAGCTCTCTACAGCCATGGCTTTGATCGGCGG 6498 

Qy 664 6 CCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTT 67 05 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 

Db 6499 GCCTCCTGTGGTGTTTCTGGATGAACCCACCACAGGCATGGATCCCAAAGCCCGGCGGTT 6558 

Qy 67 06 C CT CT GGAAC CT C AT C C T C GAC CT CAT C AAG ACAG GGC GT T C AGT GGT GCT GACAT CAC A 6765 

I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6559 CTTGTGGAATTGTGCCCTAAGTGTTGTCAAGGAGGGGAGATCAGTAGTGCTTACATCTCA 6618 

Qy 6766 CAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCT 6825 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6619 T AGT AT GGAAGAAT GT GAAGCTCT TT GCACTAGGATGGCAAT CATGGT CAATGGAAGGTT 6678 

Qy 6826 G C GGT GC C T GGGCAG CAT C CAGC AC C T GAAGAAC C GGT T T GGAGAT G G CT ACAT GAT CAC 6885 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6679 C AG GT G C C TT GG CAGT GT C C AG CAT CT AAAAAAT AGGT T T G GAGAT GGT TAT AC AAT AGT 6738 

Qy 6886 GGTGCGGA CCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAA 6942 

I I I I I I I I I II I I I I I I II I I I I I I I 

Db 6739 T GT AC GAAT AGCAGG GT C CAAC C C GGAC CT GAAG C CT GT C C AGGAT T T CT T T GGAC T T G C 6798 

Qy 6943 C T T C C C G GAAG C CAT GCT C AAG GAG C G G CAC C AC AC AAAG GT G CAGT AC C AG C T C AAGT C 7002 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6799 AT T T C C T GGAAGT GT T C CAAAAGAGAAAC AC C GGAACAT G C T ACAAT AC CAGC T T C CAT C 6858 

Qy 7003 GGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGG 7062 

I I I I I I I I I I I I I I I I I I III M 

Db 6859 TT CAT TAT CT T C T C T GGC C AGGAT AT T C AG CAT C CT CT C C CAGAGC AAAAAGC GAC T C CA 6918 



Qy 7063 CAT C GAGGACT AC T C GGT CAG C C AGAC C AC ACT G GAC AAT GT GT T C GT GAACTT T G C CAA 7122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 6919 C AT AGAAGACT AC TCTGTTTCT C AGAC AAC AC T T GAC C AAGT AT T T GT GAAC T T T GC C AA 6978 

Qy 7123 GAAGCAGAGTGA 7134 

I I II I I I I I 
Db 697 9 G GAC CAAAGT GA 6990 
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CC The present sequence is a polymorphic coding sequence for human ATP- 

CC binding cassette (ABCAl) transporter. This sequence can be used for 
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CC of high density lipoprotein (HDL) cholesterol, especially familial HDL 

CC deficiency conditions such as Tangier disease, myocardial infarction, 

CC atherosclerosis and other cardiovascular diseases. This sequence 

CC comprises mutation s-54e23, also given in ABN99268, and the alternative 

CC form of the polymorphism is shown in ABL58157 

XX 

SQ Sequence 9870 BP; 2670 A; 2222 C; 2339 G; 2638 T; 0 U; 1 Other; 
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Best Local Similarity 52.8%; Pred. No. 8.6e-154; 

Matches 2855; Conservative 0; Mismatches 2300; Indels 257; Gaps 23; 

Qy 174 5 T T CAT GT C C AAG GT GAGC GT G GAC AT C T T C AAG GGCTTCCCC GAC GAG G AGAGC AT T GT C 18 04 

I I I I I I I I I I I I II I II III III I I I I 

Db 1814 T T CAT GGAGT GT GT CAAC CT GAAC AAGCT AGAAC C CAT AG C AACAGAAGT CT GGC T CAT C 187 3 

Qy 18 05 AACTACAC C CT CAAC CAGGC CT ACCAGGACAAC GT CACT GTTT T T GCC AGT GT GAT CTT C 18 64 

I I I I I I I I I I III I I I I III II 

Db 18 7 4 AACAAGT CCAT G GAGCT GCT G GAT GAGAG GAAGTT C T GGG CT G GT AT T GT GT T CAC T GGA 1933 

Qy 18 65 CAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCC 1924 

III I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1934 AT TACT C CAGGC AG CAT T G AG CT GC C C CAT CAT GT C AAGT ACAAGAT C C GAAT GG AC AT T 1993 

Qy 1925 AGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACT 1984 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 1994 GACAAT GT G GAGAG GACAAAT AAAAT CAAG GAT GGGT ACT G G GAC CC T G GT C CT C GAGC T 2 053 

Qy 1985 GGCGGCCGCTTCTACTTCCTCTAC GGCTT CGT CT GGAT CCAGGACAT GATG 2035 

I I I I I I I I I I I I I II I I I I I I I I I I II I I 

Db 2054 GACCCCTTTGAGGACATGCGGTACGTCTGGGGGGGCTTCGCCTACTTGCAGGATGTGGTG 2113 

Qy 203 6 GAGC G C GC C AT CAT C G ACAC TTTTGTGG GGC AC GAC GT G GT G GAG C C AGG C AGCT AC GT G 2095 

I I II I I I I I I I II I I I I I I I I I I I I I I II I I 

Db 2114 GAGCAGGCAATCAT CAGGGT GCT GAC GGGCACCGAGAAGAAAACT GGT GT CT AT AT G 2170 

Qy 2096 C AG AT GT T C C C C T AC C C C T G C T AC AC AC G C GAT GAC TTCCTGTTTGT CAT T GAG CAC AT G 2155 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 2171 CAACAGATGCCCTATCCCTGTTACGTTGATGACATCTTTCTGCGGGTGATGAGCCGGTCA 2230 

Qy 2156 ATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATC 2215 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I 

Db 2231 ATGCCCCTCTTCATGACGCTGGCCTGGATTTACTCAGTGGCTGTGATCATCAAGGGCATC 22 90 

Qy 2216 G T G G C G GAG AAG GAG CAC C G G C T CAAG G A G GT GAT G AAG AC CAT G G G C C T G AAC AAC G C G 2275 

III I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I I I I I 

Db 2291 GT GT AT GAGAAGGAGGC AC GGCT GAAAGAGAC CAT G C GGAT CAT G GGC CT GGACAAC AG C 2350 

Qy 227 6 GTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCA 2335 

I I I I I I I I I I I I I I I I I III M II I II 

Db 2351 ATCCTCTGGTTTAGCTGGTTCATTAGTAGCCTCATTCCTCTTCTTGTGAGCGCTGGCCTG 2410 

Qy 2336 CTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGG 2395 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2411 CTAGTGGTCATCCTGAAGTTAGGAAACCTGCTGCCCTACAGTGATCCCAGCGTGGTGTTT 2470 



Qy 



239 6 CTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTG 2 4 55 



1 1 1 1 1 1 1 Ill 1 1 1 1 1 1 1 1 1 I II 

Db 2471 GTCTTCCTGTCCGTGTTTGCTGTGGTGACAATCCTGCAGTGCTTCCTGATTAGCACACTC 2530 

Qy 245 6 TACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTG 2 515 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I 
Db 2531 TTCTCCAGAGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTG 25 90 

Qy 2516 C C C T AC AT GT AC G T G G C GAT C C GAG AG GAG GIlGGC G C AT GAT AAG AT C AC G G C CT T C GAG 2575 

I I I I I I III III I I I I I I I I 

Db 2591 CCCTAC GTCCTGTGTGTGGCATGGCAGGACTACGTGGGCTTCACACTC 2638 

Qy 2576 7\AGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCG 2635 

III I I I I I III I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2639 AAGATCTTCGCTAGCCTGCTGTCTCCTGTGGCTTTTGGGTTTGGCTGTGAGTACTTTGCC 2 698 

Qy 2636 CTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAG 2695 

I I I I I I I I I I I I I II I I I I I II I I I I I II I I I I I I I I 

Db 2699 C T T TT T GAGGAGC AG G GC ATT G GAGT G C AGT GGGACAAC CT GT T T GAGAGT C C T GT G GAG 2758 

Qy 2696 GGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTAT 2755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2759 GAAGATGGCTTCAATCTCACCACTTCGGTCTCCATGATGCTGTTTGACACCTTCCTCTAT 2 818 

Qy 2756 GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 2815 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2819 GGG GT GAT GAC CT G GT AC AT T GAGGCT GT CT T T C CAG GC CAGT AC GGAAT T C C C AGGC CC 2 878 

Qy 2816 TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 2875 

I I I I I II I I I I II I I I I I I II I I II I I 
Db 2879 TGGTATTTTCCTTGCACCAAGTCCTACTGGTTTGGCGAGGAAAG 2922 

Qy 287 6 TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 2935 

I II I I III I II 

Db 2923 T GAT GAGAAGAGCCACC CT GGT 2 944 

Qy 293 6 GCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTG 2995 

I I I IN I I II I I I I I I I I I I I I I I I II I I II I I I 

Db 294 5 T C C AAC C AGAAGAG AAT AT C AGA AAT CT GC AT GGAG GAG GAAC C C AC C C ACT T G 2998 

Qy 2996 CCTCTGGTTGTCT GC GT G GACAAACT C AC CAAG GT CT ACAAG GAC GACAAGAAG C T GGC C 3055 

I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I 

Db 2999 AAGCTGGGCGTGTCCATTCAGAACCTGGTAAAAGTCTACCGAGATGGGATGAAGGTGGCT 3058 

Qy 305 6 CT GAAC AAG C T GAGC CT GAAC CT CT AC GAGAAC CAG GTGGTCTCCTTCTTGGGC C AC AAC 3115 

I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3059 GT C GAT G GC CT GG C AC T GAAT T T T TAT GAGGG C C AGAT C AC CTCCTTCCTGGGC C AC AAT 3118 

Qy 3116 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 3175 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I 

Db 3119 GGAGCGGGGAAGACGACCACCATGTCAATCCTGACCGGGTTGTTCCCCCCGACCTCGGGC 3178 

Qy 3176 T C C G C C AC CAT C T AC GGG C AC GAC AT C C G C AC GGAG AT G GAT GAG AT C C G CAAG AAC C T G 3235 

I I I I I I II I II I I I I I I I I I I I I I I I I Mill I I I I I I I I 

Db 317 9 AC C GC CT AC AT C C T G G GAAAAGAC AT T C G CT CT GAGAT GAG CAC CAT C C GGC AGAAC C T G 3238 

Qy 3236 GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 3295 

II I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 



Db 



3239 GGGGTCTGTCCCCAGCATAACGTGCTGTTTGACATGCTGACTGTCGAAGAACACATCTGG 32 9 8 



Qy 3296 TT CTACT CACGGCT CAAGAGCAT GGCTCAGGAGGAGAT CC GCAGAGAGAT GGACAAGAT G 3355 

I I I I I III III I I I I I I I I I I II I II I I I I I I I I 

Db 3299 T T CT AT GCCCGCTT GAAAGGGCT C T CT GAGAAG C AC GT GAAGGC G GAGAT GGAG C AGAT G 3358 

Qy 3356 ATCGAGGACCTGG AGCT C T C C AACAAAC GG CACT CAC T GGT G CAGAC AT T GT C GGGT 3412 

I I I I I I I I I I I I II I I I I I I I I I I 

Db 3359 GCCCTGGATGTTGGTTTGCCATCAAGCAAGCTGAAAAGCAAAACAAGCCAGCTGTCAGGT 3418 

Qy 3413 GGCATGAAGCGC7iAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATC 3472 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3419 GGAATGCAGAGAAAGCTATCTGTGGCCTTGGCCTTTGTCGGGGGATCTAAGGTTGTCATT 3478 

Qy 3473 CTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATC 3532 

I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 3479 CTGGATGAACCCACAGCTGGTGTGGACCCTTACTCCCGCAGGGGAATATGGGAGCTGCTG 3538 

Qy 3533 C T G AAGT AC AAGC CAGG C C GC AC CAT CCTTCTGTC CAC C CAC CAC AT GGAT GAG G CT GAC 3592 

I I I I I III I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I II II III 

Db 3539 CT GAAAT AC C GACAAGG C CGCAC CAT TAT T C T C T CT AC ACAC CAC AT GGAT GAAG C GGAC 359 8 

Qy 3593 CTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCG 3652 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 3599 GTCCTGGGGGACAGGATTGCCATCATCTCCCATGGGAAGCTGTGCTGTGTGGGCTCCTCC 3658 

Qy 3653 CTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCC 3712 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 3659 CT GT T T C T GAAGAAC CAGC T G G GAACAG G C TACT AC CT GAC CT T GGT CAAGAAAGAT GT G 3718 

Qy 3713 GAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTG 3772 

I II I I I I I I I I I I I I 

Db 3719 G AAT C CT C C CT C AGT T C C T GCAGAAACAGT AGT AGC ACT GT GT CA 3763 

Qy 37 73 AGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTG 3832 

I I I I I I I I I II I I I I II III 

Db 3764 T AC CT GAAAAAG GAGGAC AGT GT T T CT C AGAGCAGTT CT GAT GCT GG C CT GG G C AG C GAC 3823 

Qy 3833 CT GGT CT C AGACAC AAGCACG GAGCT CT C C T ACAT C CT GC C CAGC GAG GC C GC CAAGAAG 3892 

III I I I I I II II I I I I I I I I I I 

Db 3824 CAT GACAGT GACACGCT GACCAT CGAT GT CT CT GCTAT CT C CAACCT CAT CAGGAAGCAT 388 3 

Qy 38 93 GGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGC 3952 

I I II I I I I I I I I I I I I I Ml I I I I 

Db 388 4 GT GT C T GAAG CCCGGCTGGTG GAAGAC AT AGGGC AT GAGC T GACC T AT GT GC T GC CAT AT 394 3 

Qy 3953 AGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGAT 4012 

I I I I I I I I I I I I I I I I I III II I 

Db 3944 GAAGCTGC T AAGGAG GGAGC CT T T GT G GAACT CTT T CAT GAGAT T GAT GAC C GGCT C 4000 

Qy 4013 CAGT C GC T GGAGAACAGT GAGGC C GAT GT GAAG GAGT C CAG GAAGGAT GT GCT C C CT GGG 4072 

Mill I II I I I I I I I I I I 

Db 4001 T CAGAC CT G GG CAT T T C T AGT T AT GG C AT C T CAGAGAC GAC C CT G GAAG AAAT AT T C CT C 4060 

Qy 4073 GCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTG 4132 

I I I I I I I I I I I I I I I I I I I II 

Db 4061 AAGGT GG CC GAAGAGAGT GGGGT G GAT GCT GAGAC CT C AGAT G GT AC C T T GC C AG CAAGA 4120 



Qy 4133 ACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAG 4192 

I I I I I I I II II I I I I I I I I I I I M 

Db 4121 CGAAACAGGCGGGCCTTCGGGGACAAGCAGAGCTGTCTTCGCCCGTTCACTGAAGATGAT 418 0 

Qy 4193 GGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGAC 4252 

I I I I I I 

Db 4181 GCTGCTG AT C C AAAT GAT 4198 

Qy 42 53 CCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGC 4 312 

I I I I I I I II I II II II IN I M 

Db 4199 T CT GAC AT AGAC CC AGAAT C CAGAGAGACAGACT T GCT C AGT G G GAT G GAT GG CAAAG G G 4258 

Qy 4313 AGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAA 4372 

I I I I I I I II I I I III II II I I I I II II II 

Db 4259 T C C T AC C AG GT G AAAGG CT G GAAAC T T AC AC AG C AAC AGT TTGTGGCCCTTTTGT GG AAG 4318 

Qy 437 3 CGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCC 4 432 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 319 AGACTGCTAATTGCCAGACGGAGTCGGAAAGGATTTTTTGCTCAGATTGTCTTGCCAGCT 437 8 

Qy 4433 TTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCC 4492 

I II I I I I I I I I I I I I I I I I I I I I I I M I I III 

Db 4379 GTGTTTGTCTGCATTGCCCTTGTGTTCAGCCTGATCGTGCCACCCTTTGGCAAGTACCCC 4438 

Qy 4493 CCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATC 4552 

I I I I I I III I I I I I I I I I I I I I I 

Db 4439 AGC CT GGAACT T C AGC C C T GGAT GT ACAAC GAAC AGT AC AC AT TT GT CAG CAAT GAT GCT 44 98 

Qy 4553 CCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCC 4 612 

M I I I I I I I I 

Db 4499 CCTGA G GACAC GGGAAC C 4516 

Qy 4 613 CAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAG 4 672 

I I I I I I I I I I I I I I I I I I II I I I I I 

Db 4 517 CTGGAACTCTTAAACGCCCTCACCAAAGACCCTGGCTTCGGGACCCGCTGTATGGAAGGA 457 6 

Qy 4673 TCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTG 4732 

II I I I I I I I I I I I I I I I I I I Mill 

Db 4577 AAC C CAAT C C C AGACAC GC C CT G — C CAGGCAG G G GAGGAAGAGT GGAC CACT GC CCC AG 4 634 

Qy 4733 CTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTG 4792 

III Ml I I II I I I I II I M 

Db 4635 T T CC C C AGAC CAT CAT GGAC C T CTT C C AGAAT GG GAACT G GACAA 4679 

Qy 47 93 TCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGAT 4 852 

Ml I I I I I I I I I I I I II I I I 

Db 4 68 0 T G CAGAAC C CT T CACCT G CAT G C CAGT GT AG C AGC GACAAAAT CAAGAAGAT GCTGCCTG 4739 

Qy 4 853 GAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACG 4 912 

I II MM I I II M I I III I I I II M 

Db 47 4 0 TGTGTCCCCCAGGGGCAGGGGGGCTGCCTCCTCCACAAAGAAAACAAAACACTGCAGATA 4799 

Qy 4 913 TCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAG 4 972 

M II I I I I M I I I I I I II II I I 

Db 48 00 T C C T T CAGGAC C T GACAG GAAGAAAC AT T T C G GAT TAT CT G GT GAAGAC G- T AT GT G CAG 4 858 



Qy 


4973 


GGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAG-ATGCGGGTGGT 

I I 1 1 || III 1 1 1 1 1 1 1 1 1 1 1 1 1 
ATCATAGCCAAAAGCTTAAAGAACAAGATCTGGGTGAATGAG1 1 1 AGG1 Al GbubbLI 1 1 




Db 


4859 


A Ql ft 
h y _l o 


Qy 


5032 


C AC AG GC GAC AT C C T GAC C G AC AT CAC C GG C C ACAAT GT CT C T GAGT AC CT G C T CT T C AC 

III II M 1 1 1 1 IN IN III 1 

TCCCTGGGTGTCAGTAATACTCAAGCACTTCCTCCGAGTCAAGAAG1 1AAJ.GA1 bL 


+j u _/ _l 


Db 


4919 


A Q7 A 


Qy 


5092 


CTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTC 

I 1 1 1 1 I MM 1 1 II 1 1 M 
CAC C AAAC AAAT G AAG AAAC AC CTAAAG C T G G C C A AG GAC AG 




Db 


4975 


jUID 


Qy 


5152 


CATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAG 

III I M I 1 1 M 1 1 IN II II 
TT CTGCAGAT CGATTTCT CAACAGCTTGGGAAGATTTAT GACAGGACT G G AC AL C AG AAA 


Dill 


Db 


5017 


JU / D 


Qy 


5212 


GGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAG 

II I II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 
T AAT GT CAAGGT GT G GT T CAAT AACAAG GG C T G G CAT GCAAT C AG CTCTTTCCT GAAT GT 


OZ / 1 


Db 


5077 




Qy 


5272 


CCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTA 

1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 II 1 II II 1 1 MM M Mill III 
CAT CAACAAT G C CAT T CT C C G G GC CAAC CT GCAAAAG GGAGAG AACC CT AGC CAT T A 


J ool 


Db 


5137 


CI QO 

d i y o 


Qy 


5332 


C G G CAT CAC C GT CAC C AAC CAC C C CAT GAAT AAG AC C AG C G C C AG CCTCTCCCTG GAT T A 

1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 MM Mill II 

X GGAAT T ACT G CT T T CAAT CAT C C CCT GAAT CT C ACC AAGCAGCAGCT CT C AGAG GT G G C 


C O CI 1 

boy 1 


Db 


5194 


LOCI 


Qy 


5392 


CCTGCTGCAGGGCAC GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTT 

I 1 1 1 1 M 1 II II 1 1 1 1 1 1 II M 1 II 1 II 1 II M 1 1 1 
T C C GAT GAC CAC AT C AGT G GAT GTCCTTGTGTC CAT CT GT GT CAT CTTTG CAAT GT C C T T 


c, A A Q 


Db 


5254 


DjIj 


Qy 


5449 


CGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCT 

1 1 1 1 1 1 I M M II II II 1 1 M 1 1 II 1 1 II II 1 II 1 1 II II 
CGTCC CAG C C AG CT T T GT C GT AT T C CT GAT C C AG GAG CGGGT C AG CAAAGCAAAACAC CT 


jjUo 


Db 


5314 


DO /o 


Qy 


5509 


GCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACAT 

II II 1 1 MUM 1 1 1 1 1 1 II 1 1 II II 1 II 1 1 1 1 II II 1 1 1 1 1 
GCAGTTCATCAGTGGAGTGAAGCCTGTCATCTACTGGCTCTCTAATTTTGTCTGGGATAT 


CC/TQ 
JJDO 


Db 


5374 


3 4 jo 


Qy 


5569 


GCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCC 

1 II I 1 1 1 1 1 II 1 1 II II 1 M II 1 1 1 1 II 1 1 1 1 
GT GCAAT T AC GT T GT C C CT GC CACAC T G GT CAT TAT CAT CT T CAT CT G CT T C CAG CAGAA 


C* CO Q 

D vZ O 


Db 


5434 




Qy 


5629 


GGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTG 

1 1 II 1 II 1 1 1 1 1 1 II Mill 1 1 II 1 1 M 1 

GTCCTATGTGTCCTCCACCAATCTGCCTGTGCTAGCCCTTCTACTTTTGCTGTATGGGTG 


JOOO 


Db 


5494 


JJJJ 


Qy 


5689 


GTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTA 

1 II II 1 II 1 M II 1 II 1 1 II 1 1 1 II 1 1 1 II II 1 M M 1 M 1 M 

GT C AAT C ACAC CT CT C AT GT AC C CAG C CT C CT T T GT GT T CAAGAT C C C C AG CACAGC C T A 


D / 4 O 


Db 


5554 


CfTI O 

ODlo 


Qy 


5749 


CGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCT 

1 1 M II II II II II 1 1 1 II II 1 1 1 II 1 II 1 II 1 1 1 II II II 1 
TGTGGTGCTCACCAGCGTGAACCTCTTCATTGGCATTAATGGCAGCGTGGCCACCTTTGT 


5808 


Db 


5614 


5673 


Qy 


5809 


GCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTG 


5868 



Ml I I I I I I I I I I I I I I I I I I I I MM I II M M I 

5674 GCT GGAGCTGTT C AC C GACAATAAG CT GAATAATAT CAAT GAT AT CCT GAAGT CC GT 5730 

5869 CTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGA 5 92 8 

I | | I M II M I II I I M II I II II II II M I I II I I I I I 

5731 GTTCTTGATCTTCCCACATTTTTGCCTGGGACGAGGGCTCATCGACATGGTGAAAAACCA 57 90 

592 9 GT ACAT CAAC GAGT ACT ACGC CAAGAT T G GC CAGT T T GACAAGAT GAAGT C C C C GTT C GA 598 8 

IN I I I I I I M I I II I I I I I I M I I 
5791 GGCAATGGCTGATGCCCTGGAAAGGTTTGGGGAGAATCGCTTTGT GT C AC CAT TAT C 5847 

598 9 GTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCT 604 8 

I I I II I I I I M I I I I I I M I I I M I I II II I I I I I I I I I 

584 8 TTGGGACTTGGTGGGACGAAACCTCTTCGCCATGGCCGTGGAAGGGGTGGTGTTCTTCCT 5907 

604 9 CCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTAC 610 8 

I I I I I II I I I I Ml M I I I I II 

5908 CAT T AC T GT T C T GAT C CAGT AC AGAT T C T T CAT C AGGC C C AGAC C T GT AAAT G CAAAG C T 5967 

6109 CAAGCCTGTG GAG GAT GAT GT G GAC GT G G C CAGT GAG C GG CAGC GAGT GCT C CGGGG 6165 

Mill I I II II I I I I II I I M M 

5968 AT CT CCT C T GAAT GAT GAAGAT GAAGAT GT GAG G C GGGAAAGAC AGAGAAT T CT T GAT GG 6027 

6166 AGAC G C C GAC AAT GAC AT GGT CAAGAT T G AGAAC CT GAC C AAGGT CT AC AAGT C C C GGAA 6225 

I I I I I I I II I II I III III I I I I I M I II I 
602 8 T G GAG G C C AG AAT GAC AT C T T AGAAAT C AAG GAG T T GAC GAAGAT AT A TAG 607 8 

6226 GATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTT 62 85 

| M I I I I I I I I I I I I I I I I I II I I M I I I I I I M I I I I 

607 9 AAGGAAGCGGAAGCCTGCTGTTGACAGGATTTGCGTGGGCATTCCTCCTGGTGAGTGCTT 613 8 

62 86 CGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGA 6345 

II I M II I I I I I I I I I I I I I I M I M M 

6139 T GGGCT CCT GGGAGTT AAT GGGGCT GGAAAAT CAT CAACT TT CAAGAT GTT AACAGGAGA 6198 

634 6 CGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCT 6405 

I II I I I I I I I I I I I I I I I I I I I I I II 

6199 TACCACT GTTACCAGAGGAGAT GCTTT CCTTAACAGAAATAGTATCTTATCAAACATCCA 6258 

6406 CCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCAC 6465 

I | I II I I II I I I M I I I I I I II I I I I I I I I I I M I I I I 

6259 TGAAGTACAT CAGAACAT GGGCTACT GC CCT CAGTTT GATGCCAT CACAGAGCT GTT GAC 6318 

64 66 GGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGC 652 5 

I I I I I I I I I I I I I II II I I I III MIMI I 
6319 T G GGAGAGAACAC GT G GAGT T CTTTGCCCTTTT GAGAGGAGT C CC AGAGAAAGAAGT T G G 6378 

6526 CCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGC 6585 

I I I | I II I II II I II I I M I M I I II I I I I I II I I 

637 9 CAAG GT T GGT GAGT GG G C GAT T C GGAAACT GGG CCT C GT GAAGT AT G GAGAAAAAT AT GC 6438 

658 6 TGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTA 664 5 

Ml I III II II I I I I II II II M I M Mill M I M M 

6439 TGGTAACTATAGTGGAGGCAACAAACGCAAGCTCTCTACAGCCATGGCTTTGATCGGCGG 6498 

6646 CCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTT 67 05 
|| | I I I I I I I I I II II I I I I I I I I I II I II I M I II II M II II II 



Db 6499 GCCTCCTGTGGTGTTTCTGGATGAACCCACCACAGGCATGGATCCCAAAGCCCGGCGGTT 6558 

Qy 6706 CCT CT GGAACCTCATCCTCGACCT CATCAAGACAGGGCGTTCAGTGGTGCT GACATCACA 6765 

I | I I I I I IN I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6559 CTTGTGGAATTGTGCCCTAAGTGTTGTCAAGGAGGGGAGATCAGTAGTGCTTACATCTCA 6618 

Qy 6766 CAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCT 6825 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6619 TAGT AT GGAAGAAT GT GAAGCT CTTT GCACT AGGATGGCAAT CAT GGT CAATGGAAGGTT 6678 

Qy 6826 GCGGTGCCTG GGC AGCAT C C AGC AC C T GAAGAAC C GGTT T GGAGAT G GC TACAT G ATC AC 6885 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I II 

Db 6679 CAGGTGCCTTGGCAGTGTCCAGCATCTAAAAAATAGGTTTGGAGATGGTTATACAATAGT 6738 

Qy 68 8 6 GGTGCGGA C C AAGAG C AG C C AG AGT GT G AAG GAC GTGGTGCGGTTCTT C AAC C G C AA 6942 

Mill I I II II I I I I I I II I I I I I I I 

Db 6739 TGTACGAATAGCAGGGTCCAACCCGGACCTGAAGCCTGTCCAGGATTTCTTTGGACTTGC 67 98 

Qy 6943 C T T C C C G GAAG C CAT G C T C AAG GAG C G G C AC C AC AC AAAG GT G C AGT AC C AG C T C AAGT C 7002 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6799 ATT T C CT G GAAGT GT T C CAAAAG AG AAAC AC C G GAAC AT GCT AC AAT AC C AGCT T C CAT C 6858 

Qy 7 003 G GAGC ACAT CTCGCTGGCC C AGGT GT T CAGCAAGAT GGAGC AGGT GT CT GG CGT GCT G GG 7 062 

I I I I I I I I I I I I I I I II I Ml II 

Db 6859 T T CAT TAT CTTCTCTGGC C AGGAT AT T C AG CAT C CT CT C C CAGAGCAAAAAG C GAC T C C A 6918 

Qy 7 063 CAT CGAGGACTACTCGGTCAGCCAGACCACACT GGACAAT GTGTTCGT GAACTTT GCCAA 7122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 6919 C AT AGAAGACT ACT CT GT T T CT C AG AC AAC ACT T GAC CAAGT AT TTGT GAACTTT GCCAA 6978 

Qy 7123 GAAG C AG AGT G A 7134 

I I II I I I I I 
Db 6979 GGACCAAAGTGA 6990 
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ALIGNMENTS 



RESULT 1 

US-09-526-193A-2 

; Sequence 2, Application US/09526193A 

; Patent No. 6617122 

; GENERAL INFORMATION: 

; APPLICANT: Hayden, Michael R. 

; APPLICANT: Brooks-Wilson, Angela R. 

; APPLICANT: Pirns tone, Simon N. 

; TITLE OF INVENTION: METHODS AND REAGENTS FOR MODULATING 
; TITLE OF INVENTION: CHOLESTEROL LEVELS 
; FILE REFERENCE: 50110/002005 

; CURRENT APPLICATION NUMBER: US/09/526, 193A 

; CURRENT FILING DATE: 2000-03-15 

; PRIOR APPLICATION NUMBER: 60/124,702 

; PRIOR FILING DATE: 1999-03-15 

; PRIOR APPLICATION NUMBER: 60/138,048 

; PRIOR FILING DATE: 1999-06-08 

; PRIOR APPLICATION NUMBER: 60/139,600 



PRIOR FILING DATE: 1999-06-17 
PRIOR APPLICATION NUMBER: 60/151,977 
PRIOR FILING DATE: 1999-09-01 
NUMBER OF SEQ ID NOS : 2 87 

SOFTWARE: Fast SEQ for Windows Version 4.0 
SEQ ID NO 2 
LENGTH: 7 8 60 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-526-193A-2 

Query Match 12.3%; Score 986.6; DB 4; Length 7860; 

Best Local Similarity 52.6%; Pred. No. 1.5e-177; 

Matches 2847; Conservative 0; Mismatches 2309; Indels 255; Gaps 22; 

Qy 1745 T T CAT GT C CAAGGT GAGC GT GGACAT CT T CAAGG GCT T C C C C GAC GAGG AGAGCATT GT C 1804 

I I I I I I I I I I I I I I I II III III I I I I 

Db 1575 T T C AT GGAGT GT GT CAAC C T GAACAAG C T AGAAC CC AT AGCAACAGAAGT CT GGCT C AT C 1634 

Qy 1805 AAC T AC AC C CT CAAC C AG G C CT AC C AG G AC AAC G T C AC TGTTTTTGC C AGT GT GAT C T T C 1864 

I I I I I I I I I I III I I I I III II 

Db 1635 AAC AAGT C C AT GGAG CT GCT GGAT GAGAGGAAGT TCTGGGCTG GT AT T GT GTT C ACT GGA 1694 

Qy 18 65 CAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAACTCC 1924 

III I I I I I 1 I I I I I I I I I I I I I I I I I I III 

Db 1695 AT T AC T C C AG G C AG CAT T GAG C T G C C C CAT CAT GT C AAGT AC AAGAT C C GAAT G GAC AT T 1754 

Qy 1925 AGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAATACT 1984 

I I I II II I I I I I I I I I I I I I I I I I I I I II 

Db 1755 GACAAT GT G GAGAGGAC AAATAAAAT C AAG GAT G GGT ACT G GGAC CCTGGTCCTC GAGCT 1814 

Qy 1985 GGCGGCCGCTTCTACTTCCTCTAC GGCTT CGT CT GGAT CCAGGACAT GAT G 2035 

II I I I I I III I I I I I I I I I I I I I I I I I I I 

Db 1815 GACCCCTTTGAGGACATGCGGTACGTCTGGGGGGGCTTCGCCTACTTGCAGGATGTGGTG 1874 

Qy 2036 GAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTG 2095 

I I I I I I II I I I II I II I I III II III III II 

Db 1875 GAGCAGGCAATCAT CAGGGTGCTGACGGGCACCGAGAAGAAAACTGGTGTCTATATG 1931 

Qy 2096 C AGAT GT T C C C CT AC C C CT GCT AC AC AC GC GAT GACT T CCTGTTTGT CAT T GAGC AC AT G 2155 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1932 CAAC AGAT G CC CT AT C C CT GT T AC GT T GAT GACAT CTT T CT G C G GGT GAT GAG CC GGT C A 1991 

Qy 2156 AT GCC GCT GT GCAT GGT GAT CT C CT GGGT CT ACT CCGT GGCCAT GAC CAT C C AGCACAT C 2215 

I I I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I II I I 1 I I I 
Db 1992 ATGCCCCTCTTCATGACGCTGGCCTGGATTTACTCAGTGGCTGTGATCATCAAGGGCATC 2051 

Qy 2216 GT G G C G GAG AAG GAG C AC C G G C T C AAG GAG G T GAT G AAG AC CAT G G G C C T G AAC AAC G C G 2275 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 2052 GT GT AT GAGAAGGAGGC AC GGCT GAAAGAG AC CATGC GGAT CAT GGG CC T G GAC AAC AG C 2111 

Qy 2276 GTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCA 2335 

I I I I I I I I I I I II I I I I I I I I I I I I II 

Db 2112 ATCCTCTGGTTTAGCTGGTTCATTAGTAGCCTCATTCCTCTTCTTGTGAGCGCTGGCCTG 2171 

Qy 2336 CTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGG 2395 

I I I I I I I I II I I I I II I I I I I I I I I I II II 



Db 2172 CTAGTGGTCATCCTGAAGTTAGGAAACCTGCTGCCCTACAGTGATCCCAGCGTGGTGTTT 2231 

Qy 2396 CTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTG 24 55 

M II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 2232 GTCTTCCTGTCCGTGTTTGCTGTGGTGACAATCCTGCAGTGCTTCCTGATTAGCACACTC 2291 

Qy 2456 TACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTG 2515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2292 TTCTCCAGAGCCAACCTGGCAGCAGCCTGTGGGGGCATCATCTACTTCACGCTGTACCTG 2351 

Qy 2516 C C C T AC AT G T AC GT G G C GAT C C GAG AG GAG GT G G C G CAT GAT AAG AT C AC G G C C T T C GAG 2575 

I I I I I I III Ml I I I I I I I I 

Db 2352 CCCTAC GTCCTGTGTGTGGCATGGCAGGACTACGTGGGCTTCACACTC 2399 

Qy 2576 AAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCG 2635 

III I I I II III I I I I I II I I I I I I I I I I I I I I I I 

Db 24 00 AAGATCTTCGCTAGCCTGCTGTCTCCTGTGGCTTTTGGGTTTGGCTGTGAGTACTTTGCC 2459 

Qy 2636 CTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAG 2695 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 

Db 2460 CT T T T T GAGG AGC AGG G CAT T GGAGT G C AGT GG GACAAC CT GT TT GAGAGT C C T GT GGAG 2519 

Qy 2696 GGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTAT 2755 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 252 0 GAAGATGGCTTCAATCTCACCACTTCGGTCTCCATGATGCTGTTTGACACCTTCCTCTAT 2579 

Qy 2756 GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 2815 

II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 258 0 GG G GT GAT GAC CT GGT AC AT T GAG G CT GT CT T T C CAG GC CAGT AC GGAATT C C C AGGC C C 2639 

Qy 2 816 TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 2875 

I I I I I II I I I I I I I I I II I I I I I I I I I 

Db 2640 TGGTATTTTCCTTGCACCAAGTCCTACTGGTTTGGCGAGGAAAG 2683 

Qy 2 876 TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 2 935 

Mill III I II 

Db 2684 T GAT GAGAAGAGC C AC C C T GGT 2705 

Qy 2936 GCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTG 2995 

Ml I II I I II I I I I I I II I I I I I I I II I II I I I I 

Db 27 0 6 T C C AAC C AGAAG AGAAT AT CAG A AAT CT GCAT GGAGGAGGAAC C C AC C C ACT T G 2759 

Qy 2996 CCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCC 3055 

I I I I I I I I I I I I II I I I I I I I I III I I I I I I I II 

Db 2760 AAGCT G GGC GT GT C CAT T C AGAAC C T GGTAAAAGT CT AC C GAGAT GG GAT GAAG GT G G C T 2819 

Qy 3056 C T G AAC AAG C T GAG C C T G AAC C T C T AC GAG AAC CAG GTGGTCTCCTTCTTGGGC C AC AAC 3115 

I I II I I I II I I I I I I I II I I I I I I I I I I I I I I I I i I I I 

Db 2820 GT C GAT GGCCT G GC ACT GAAT T T T TAT GAG GGC CAGAT C AC CTCCTTCCTGGGC C ACAAT 2879 

Qy 3116 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 3175 

II I I II I INN I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II MMI 

Db 288 0 GGAGCGGGGAAGACGACCACCATGTCAATCCTGACCGGGTTGTTCCCCCCGACCTCGGGC 2 939 

Qy 317 6 T C C G C C AC CAT C T AC G G G C AC GAC AT C C G C AC G GAGAT G GAT GAGAT C C G C AAG AAC C T G 3235 

Mill I II I II I I I I I I II I I I I I I I I II I I I II I I I I II 

Db 294 0 AC C G C C T A C AT C C T G G G AAAAG AC AT T C G C T C T GAGAT GAG C AC CAT C C G G CAG AAC C T G 2999 



Qy 


3236 


GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 

ii I il II 1 1 1 1 1 II 1 1 1 E 1 1 1 1 1 1 1 III II II II 1 1 1 1 1 1 1 1 1 1 1 

II 1 II II Mill II 1 II 1 1 1 1 1 1 1 1 Ell II M II 1 1 1 1 IE 1 1 II l 
GGGGTCTGTCCCCAGCATAACGTGCTGTTTGACATGCTGACTGTCGAAGAACACATCTGG 


3295 


Db 


3000 


3059 


Qy 


3296 


T T C T AC T C AC G G C T C AAG AG CAT G G C T C AG GAG GAG AT C C G C AG AG AG AT G G AC AAG AT G 

ill ii] i i i i i i i i i i i i i i i i i i i i i l l 

I I 1 1 1 III III 1 1 1 1 1 1 1 I 1 1 1 1 IE 1 1 1 1 1 1 1 1 1 

T T CT AT G CC CGCT T GAAAG GGCTCTCT G AGAAGC AC GT GAAG G C G GAG AT GGAGCAGAT G 


3355 


Db 


3060 


3119 


Qy 


3356 


AT C GAGGAC CT G G AGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGT 

i iii ii ii i i i i i i i i i i i i i i i i 
1 III II II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

GC C CT G GAT GTTGGTTTGC CAT C AAG C AAGC T GAAAAG C AAAAC AAG C C AG CT GT C AG GT 


3412 


Db 


3120 


3179 


Qy 


3413 


GGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATC 
■ I iii ii i i i i i i ii i i i i i i i i i i i i ii ii ii iii i i i \ i 

II III II 1 1 1 1 1 1 II MINI 1 1 1 1 1 1 II II II III 1 1 1 1 1 

GGAATGCAGAGAAAGCTATCTGTGGCCTTGGCCTTTGTCGGGGGATCTAAGGTTGTCATT 


3472 


Db 


3180 


3239 


Qy 


3473 


CTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATC 

■ i i i i ii i i i i i ii ii i i i i i i i i iii i iii i i ii i i i i i ii i 
1 1 1 1 1 II 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 III 1 IN 1 1 II 1 1 1 1 1 II ! 

CTGGATGAACCCACAGCTGGTGTGGACCCTTACTCCCGCAGGGGAATATGGGAGCTGCTG 


3532 


Db 


3240 


3299 


Qy 


3533 


C T G AAGT AC AAGC C AG G C C G C AC CAT CCTTCTGTC C AC C C AC C AC AT G GAT G AGG C T GAC 
■ i i i i iii i i i i i i i i i i i i i i i i i ii ii i i i i i i i i i i i i i i ti iii 

I I I 1 1 Ml 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 II II 1 1 1 II 1 1 1 1 1 1 1 1 1 II III 

CT GAAAT AC C GACAAGGC C G C AC CAT TAT T CT CT CT ACAC AC C ACAT GGAT GAAGC GGAC 


3592 


Db 


3300 


3359 


Qy 


3593 


CTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCG 
■ ii i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ii i i i i i i i 

1 II II II 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 1 1 1 1 M II II II II II 1 1 1 1 1 

GTCCTGGGGGACAGGATTGCCATCATCTCCCATGGGAAGCTGTGCTGTGTGGGCTCCTCC 


3652 


Db 


3360 


3419 


Qy 


3653 


CTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCC 
i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

II 1 1 1 1 1 1 1 1 II 1 1 1 II Mill 1 M 1 M 1 1 1 

C T GT T T CT GAAGAAC C AG CT GG GAAC AGG C TACT AC CT GAC CT T GGT CAAGAAAGAT GT G 


3712 


Db 


3420 


3479 


Qy 


3713 


GAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTG 

i ii i i i i i i i i i i i i 
| II 1 1 1 1 1 1 1 1 1 1 1 1 

G AAT C CT C C CT CAGTT CCT GC AGAAACAGT AGT AGCACT GT GT C A 


3772 


Db 


3480 


3524 


Qy 


3773 


AGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTG 
■ iii i i i i i i i i ii i t t iii 

I Mil 1 1 1 1 1 1 1 II 1 II III 

T AC CT GAAAAAGGAGGAC AGT GT T T CT C AGAGC AGT T CT GAT GCTGGCCTG G GC AG C GAC 


3832 


Db 


3525 


3584 


Qy 


3833 


CT G GT CT CAGACACAAG CACGGAGC T CT C CT AC AT C CT GC C C AGC GAG G C C GC C AAGAAG 
ii i i i i i ii ii i i i i i i I I I I 


3892 


Db 


3585 


II II II 1 II M 1 II 1 1 1 1 1 1 1 
CAT GAGAGT GACACGCT GACCAT CGAT GT CT CT G CT AT CT C C AAC C T CAT CAGGAAGCAT 


3644 


Qy 


3893 


GGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGC 

i i i i i i i i i i > i i i i i i iii iii i 
1 1 1 1 1 II II 1 1 II 1 1 1 1 M 1 IM 1 

GT GT CT GAAGC CC GG CT GGT G GAAGACAT AG G GCAT GAGC T GAC CT AT GT GCT G C CAT AT 


3952 


Db 


3645 


3704 


Qy 


3953 


AGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGAT 

1 1 1 II II 1 1 II M 1 M 1 III M 1 
GAA GCTGCTAAGGAGGGAGCCTTTGTGGAACTCTTTCATGAGATTGATGACCGGCTC 


4012 


Db 


3705 


3761 


Qy 


4013 


CAGTCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGG 

Mill 1 1 1 Mill Mil 1 

T C AGAC CT G G GC AT T T CT AGT TAT G G CAT CT CAGAGAC GAC C CT G GAAGAAAT AT T C CT C 


4072 


Db 


3762 


3821 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



4 073 GCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTG 4132 

I I I I I I I I I I II II I I I I I II 

3822 AAGGT GGC C GAAGAGAGTGGGGT GGATGCT GAGACCT CAGAT GGTAC CTT GC CAGCAAGA 38 81 

4133 ACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAG 4192 

I I I I I I I II II I I I I I I I I I I I I I 

3882 CGAAACAGGCGGGCCTTCGGGGACAAGCAGAGCTGTCTTCGCCCGTTCACTGAAGATGAT 3941 

4193 G GAG CT GG CT AC AC C GAC GT CT AT GGC G AC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC 4252 

I II I I I I I I I I I 

3942 GCTGCTG AT C C AAAT GAT 3959 

4253 CCAGACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGC 4312 

I I I I I I I II I II I I I I I 

3960 T CT GACAT AGAC C C AGAAT C C AGAGAGACAGAC T T G CT C AGT GGGAT G G AT GGCAAAGGG 4019 

4 313 AGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAA 4372 

I I I I I I I I I I I I III II I I I I I I II II II 

4020 T C C T AC C AG G T G AAAG G C T G G AAAC T T AC AC AG C AAC AG TTTGTGGCCCTTTTGTG G AAG 4079 

4373 CGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCC 4432 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4080 AGACTGCTAATTGCCAGACGGAGTCGGAAAGGATTTTTTGCTCAGATTGTCTTGCCAGCT 4139 

4433 TTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCC 44 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

4140 GTGTTTGTCTGCATTGCCCTTGTGTTCAGCCTGATCGTGCCACCCTTTGGCAAGTACCCC 4199 

4493 CCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATC 4552 

I I I I I I III I I I I I I I I I I I I I I 

4200 AGC C T GGAACT T CAG C C CT GGAT GT AC AAC GAAC AGT AC AC AT T T GT C AG CAAT GAT GCT 4259 

4 553 CCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCC 4612 

III MM ] II 

42 60 CCTGA GGAC AC GGGAAC C 4277 

4 613 CAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAG 4672 

I I I I I I I I I I II III III II III II 

4278 CT GGAACT CTT AAACGCCCTCACCAAAGACCCTGGCTTCGGGACCCGCTGT AT GGAAGGA 4337 

4 673 TCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTG 4732 

II I I I I I I I I I I I I I I I I II I I I I I 
4338 AACC CAAT C C C AGAC AC GC C CT G — C C AGGCAGG G GAGGAAGAGT GGAC C AC T GC C CC AG 4395 

4733 CTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTG 4792 

I I I I I I I I I I I I I I I I I II 

4396 T T C C C C AGAC CAT CAT G GAC C T CT T C C AGAAT GG GAACT G G AC AA 444 0 

47 93 TCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGAT 4852 

III I I I I I II I I I I I I I I II 

44 41 T GCAGAAC CCTT CACCT GCAT GC CAGT GTAGCAGCGACAAAAT CAAGAAGAT GCTGCCT G 4500 

4 853 GAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACG 4912 

I I I I I I I I I I I I I I I I I I I I I I I M 

4501 TGTGTCCCCCAGGGGCAGGGGGGCTGCCTCCTCCACAAAGAAAACAAAACACTGCAGATA 4560 

4 913 TCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAG 4972 



Db 


4561 


M || II 1 I 1 1 1 1 1 1 1 1 II MM 

TCCTTCAGGACCTGACAGGAAGAAACAI 1 1 LbGAJ. 1 AI L 1 bb 1 bMbAL b- lAibibbAb 


*± U -L -7 


Qy 


4973 


GGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTC 

| | I | II III 1 1 1 1 1 1 1 1 1 1 1 
ATCATAGCCAAAAGCTTAAAGAACAAGA1 LI bbblbAAl bAb 1 1 lAbbl/\i bbbu 


5032 


Db 


4620 


1 VJ / 1 


Qy 


5033 


ACAGGC GACAT C CT GAC C GACAT C AC C GGC C AC AAT GT CT CT GAGT AC CTGCTCTT CACC 
| | 1 1 1 1 1 1 1 III II 1 1 1 1 1 1 

GCTTTTCCCTGGGTGTCAGTAA1 AL1 LAAbLAL 1 i bbl LLbAbl LAAbAAbl lI\t\L btt.-L \j 


5092 


Db 


4675 




Qy 


5093 


TCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCC 

I I II 1 1 1 1 1 II II 
C CAT C AAAC AAAT GAAGAAAC AC C T AAAG blbbb LAAb b Ab Ab l 




Db 


4735 


4 77 


Qy 


5153 


ATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGG 

II 1 1 1 1 1 1 1 1 1 1 1 IN M II 
TCTGCAGATCGATTTCTCAACAGCTTGGGAAGATTTATGALAGbAL 1 b bALAb LAG AAA 1 




Db 


4779 


4 ft ^ P 
*i O O 0 


Qy 


5213 


G C T G C C C AG GT T T T C T AC AAC AAC AAG GGC TAT C AC AG CAT G C C C AC C T AC C T C AAC AG C 

I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 
AATGTCAAGGTGTGGTTCAATAACAAGGGCTGGCATGCAATCAGCTCTTTCCTGAAl GIL 


5272 


Db 


4839 


4 0 y 0 


Qy 

Db 


5273 
4899 


CTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTAC 

| | | | | || I I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 HI 
AT C AAC AAT GC CAT TCTCCGGGC C AAC C T G C AAAAG G GAG AG AAC C L I AG LLA1 1A1 


^ "5 ^ 9 

4 Q R R 


Qy 


5333 


GGCAT CACCGT CACCAAC C AC CCCAT GAAT AAGACCAGCGC CAGCCT CT CCCT GGATT AC 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 MMI M 

GG7\ATTACTGCTTTCAATCATCCCCTGAATCTCACCAAGCAGCAGC 1 0 1 bAbAbb 1 bbbl 


S^ Q9 


Db 


4956 


sm s 


Qy 


5393 


CTGCTGCAGGGCAC GGAT GT CGT CAT C GC CAT CTT CAT CAT C GT GGCCAT GT CCTT C 

I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M II 1 1 

CTGATGACCACATCAGTGGATGTCCTTGTGTCCATCTGTGTCATCTTTGCAAl Gl lb 




Db 


5016 


R 07 R 


Qy 


5450 


GTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTG 

II 1 1 1 II 1 Mill 1 III 1 1 1 1 1 1 II 1 1 1 1 1 1 1 

GT C CCAG C C AGCT T T GT C GT AT T C CT GAT C C AG GAGC GG GT C AG OAAAG bAAAAbAb bib 


jOU ^ 


Db 


5076 


JlJJ 


Qy 


5510 


CAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATG 

| I II 1 1 II 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 II M 1 1 1 1 1 1 
CAGTTCATCAGTGGAGTGAAGCCTGTCATCTACTGGCTCTCTAATTTTGTCTGGGATATG 




Db 


5136 


CI QC 


Qy 


5570 


CTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCG 

II 1 1 1 1 1 1 1 1 1 II II II 1 1 1 II 1 1 1 1 

TGCAATTACGTTGTCCCTGCCACACTGGTCATTATCATCTTCAI LI GOl i L LAG bAbAAb 




Db 


5196 


R9 S S 


Qy 


5630 


GCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGG 

MM Ml 1 II 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II II 1 M 1 1 1 1 

TCCTATGTGTCCTCCACCAATCTGCCTGT GCI AGLLLl 1LIAL1 III GLlGlAlLrbbl bb 


J U O _7 


Db 


5256 


J j1 J 


Qy 


5690 


TCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTAC 

1 1 1 II II II II 1 1 II II 1 1 1 II II M 1 1 II 1 M 1 II 1 1 1 1 1 1 II M 1 
T C AAT CACACCTCTC AT GTACC CAGCCT CCTTTGTGTTCAAGATCCCCAGCACAGCCT AT 


5749 


Db 


5316 


5375 


Qy 


5750 


GTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTG 
II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 IMIM 1 1 1 1 M 


5809 



Db 



537 6 GTGGTGCTCACCAGCGTGAACCTCTTCATTGGCATTAATGGCAGCGTGGCCACCTTTGTG 5435 



Qy 5810 CT ACAGCT CT T C GAG CAC GACAAG GACC T GAAG GT T GT C AAC AGT T ACC T GAAAAGCT GC 58 69 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5436 CTGGAGCTGTTC AC C GAC AAT AAG C T G AAT AAT AT C AAT GAT AT C C T G AAGT C C GT G 5492 

Qy 587 0 T T C CT C AT TT T C C C CAACT ACAAC CT GGG C C AC GGGCT CAT G GAGAT G G C CT ACAAC GAG 5 929 

III I I I I I I I I I I I I I I I I I I I I I I I I I I II II 

Db 5493 TTCTTGATCTTCCCACATTTTTGCCTGGGACGAGGGCTCATCGACATGGTGAAAAACCAG 5552 

Qy 5930 T AC AT C AAC G AGT AC T AC G C C AAG AT T G G C C AG T T T G AC AAGAT G AAGT CCCCGTTC GAG 5989 

II II I I I I I I I I I I I I I I I I I I I I 
Db 5553 GCAATGGCTGATGCCCTGGAAAGGTTTGGGGAGAATCGCTTTGT GT CAC CAT TAT CT 5609 

Qy 5990 TGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTC 6049 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 5610 TGGGACTTGGTGGGACGAAACCTCTTCGCCATGGCCGTGGAAGGGGTGGTGTTCTTCCTC 5669 

Qy 6050 CTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACC 6109 

III I II I I II I I I I I I I I I I M I I M 

Db 5670 ATTACT GTT CT GAT C CAGTACAGATT CTT CAT CAGGCCCAGACCT GTAAAT GCAAAGCTA 5729 

Qy 6110 AAGCCTGTG GAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGA 6166 

I I I I I I I II I I I I I I I I I I I I I I II I I I I I II 

Db 5730 TCTCCTCT GAAT GAT GAAGAT GAAGAT GT GAG G CGG GAAAGAC AGAGAAT T CT T GAT GGT 5789 

Qy 6167 GAC GC C GACAAT GACAT GGT CAAGAT T GAGAAC CT GAC CAAG GT CT AC AAGT C C C GGAAG 622 6 

I I I I I I I I I I II I III III I I I I I I I I I I I 
Db 5790 GGAGGC CAGAAT GACAT CTT AGAAAT CAAGGAGTT GACGAAGATAT A TAGA 5840 

Qy 6227 ATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTC 6286 

I III I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 5841 AGGAAGCGGAAGCCTGCTGTTGACAGGATTTGCGTGGGCATTCCTCCTGGTGAGTGCTTT 5900 

Qy 6287 GGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGAC 6346 

I I I I I I I I I I I I I I I I I I I II M 1 I I I I I I I I I I I I I I I I I I 

Db 5901 GGGCT C CT GG GAGT TAAT G GGGCT GGAAAAT C ATC AACT T T CAAGAT GT T AACAG GAGAT 5960 

Qy 6347 GAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTC 6406 

I II I II II II III I II I I I I I I III 

Db 5961 ACCACT GTT ACCAGAGGAGAT GCT TT CCTT AACAAAAATAGT AT CTT AT CAAACAT CCAT 602 0 

Qy 64 07 CAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACG 64 66 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I 

Db 6021 GAAGT ACAT CAGAACAT GGGCTACTGCC CT CAGTTT GAT GC CAT CACAGAGCT GTT GAC T 6080 

Qy 64 67 GCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCC 6526 

I I I I I I I I I II I I II I I I I I I I I I I I I I I I I 

Db 6081 GGGAGAGAACAC GT G GAGT TCTTTGCCCTTTT GAGAG GAGT C C CAGAGAAAGAAGT T GGC 6140 

Qy 6527 CGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCT 6586 

I I I I I I II I I I I II I I II I II I I I I I I I I I I I III 

Db 6141 AAGGT T G GT GAGT G GG C GATT C GGAAAC T G GGC CT C GT GAAGT AT G GAGAAAAAT AT GCT 6200 

Qy 6587 GGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTAC 6646 

II I III II II I I I I I I I I II I I I I II I I II I I I II M I M M 

Db 6201 GGTAACTATAGTGGAGGCAACAAACGCAAGCTCTCTACAGCCATGGCTTTGATCGGCGGG 6260 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



6647 CCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTC 6706 

II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

6261 CCTCCTGTGGTGTTTCTGGATGAACCCACCACAGGCATGGATCCCAAAGCCCGGCGGTTC 632 0 

6707 CT CT GGAAC C T CAT C CT C GAC CT C AT C AAGAC AG G GC GT T C AGT G GT G CT GACAT C AC AC 6766 

I I I I I I III I I I I I I I II I I I I II I I I I I I I I I I I I 

6321 T T GT G GAAT T GT GC C CT AAGT GT T GT CAAG GAG G GGAGAT CAGT AGT GCT T ACAT C T CAT 638 0 

6767 AGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTG 682 6 

I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I 

63 81 AGT AT G GAAGAAT GT GAAGCT CTT T GC ACT AG GAT GG CAAT CAT GGT CAAT G GAAGGT T C 64 4 0 

6827 C GGT GC CT G GG C AGC AT C CAG C AC CT GAAGAACC G GT T T GGAGAT G GCT ACAT GAT CAC G 68 8 6 
I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I M 

64 41 AGGT GC C T T G G CAGT GT C C AGCAT CTAAAAAAT AGGT TT GGAGAT GGT T ATACAAT AGT T 65 00 

6887 GTGCGGA C C AAGAGC AGC CAGAGT GT GAAGGAC GT GGT GC G GT T CTT C AAC C G CAAC 6943 

I I I I I I I I I I I I I I I I I M I Mill I 

6501 GT AC GAAT AGC AG GGT C CAAC C C GGACCT GAAG C CT GT C C AGGAT T T C T T T G GACT T G C A 6560 

6944 T T C C C GGAAG C CAT G CT CAAG GAG C GGC AC CAC ACAAAG GT GC AGT AC C AGCT CAAGT C G 7003 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

6561 TTTCCT GGAAGT GTT CTAAAAGAGAAACACCGGAACAT GCT ACAAT ACCAGCTT CCAT CT 6620 

7 004 GAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGC 7063 

I I I I I I I I I I I I I I I I I I III M I 

6621 T CAT TAT C T T CT CT G GC C AGGAT AT T CAGC AT C CT CT CC C AGAGCAAAAAG C GACT C CAC 668 0 

7064 AT C GAG GAC T AC T C G GT CAG C C AGAC CAC ACT G G AC AAT GT GT T C GT GAACT T T GC CAAG 7123 

II I I I II I I I I I II I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I 
6681 ATAGAAGACTACT CT GTTTCT C AGACAAC ACT T GAC CAAGT AT T T GT GAACT TTGC CAAG 674 0 

712 4 AAG CAGAGT GA 7134 

I II Mill 
6741 GAC C AAAGT G A 6751 



RESULT 2 

US-09-833-381-958 

; Sequence 958, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
; FILE REFERENCE: 5800-119 

; CURRENT APPLICATION NUMBER: US/09/ 833 , 381 

; CURRENT FILING DATE: 2001-04-11 

; PRIOR APPLICATION NUMBER: 09/516,448 

; PRIOR FILING DATE: 2000-02-29 

; NUMBER OF SEQ ID NOS : 2 050 

; SOFTWARE : FastSEQ for Windows Version 3.0 
; SEQ ID NO 958 

LENGTH: 3609 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-09-833-381-958 



Query Match 7.6%; Score 612.6; DB 4; 

Best Local Similarity 61.0%; Pred. No. 6.6e-107; 
Matches 1151; Conservative 0; Mismatches 694; 



Length 3609; 
Indels 42; Gaps 



Qy 


5218 


C C AG GTT T T CT ACAACAAC AAG GGCT AT C AC AG CAT GC C C AC C T AC CT CAACAG C CT CAA 

i ii i i i l l l l l l l l l MM Ml MM Ml M M 1 1 M 

| | | I 1 1 1 1 1 ! 1 1 1 I 1 1 1 1 1 IN INI Ml Mill 1 M 
CAAGATCTGGTTCAACAACAAAGGCTGGCACTCCATGGTGGCCTTTGTCAACCGAGCCAG 


5277 


Db 


1587 


1646 


Qy 


5278 


CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 

i i i i i i i i i i i iiitt i I I M 1 1 1 M M 1 M M M MM 

I | | I II 1 II 1 1 II 11 1 1 1 I 1 1 1 II II Ml M M M 1 1 M 
CAACGCAATCCTCCGTGCTCACCTGCCCCCAGGCCCGGCCCGCC ACGCCCACAGCAT 


5337 


Db 


1647 


1703 


Qy 


5338 


CACCGT CAC CAAC CAC CC CAT GAAT AAGACCAGCGCC AGC CT CT CC CT GGATT AC CTGCT 

i i i i i i i i i i i i i i i i I I 1 1 1 1 1 II t 1 M 1 Ml 1 

I I I 1 II 1 1 1 1 II 1 1 II 1 1 MM 1 1 1 1 1 III 1 1 1 1 

CACCACACTCAACCACCCCTTGAACCTCACCAAGGAGCAGCTGTCTGAGGGTGCACTGAT 


5397 


Db 


1704 


1763 


Qy 


5398 


GCAGGGCAC GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCC 

■ i i iii iii ii ii i i i i i i i i< i i i i i i i i i i i i ii ii 

I II 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 II 1 1 1 1 1 1 M 1 1 II 1 1 1 1 

GGCCTCCTCGGTGGACGTCCTCGTCTCCATCTGTGTGGTCTTTGCCATGTCCTTTGTCCC 


5454 


Db 


1764 


1823 


Qy 


5455 


GGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTT 

...ii i i i i i i i i I III 1 1 1 1 1 1 M 1 II 1 1 1 M M 1 

1 I I II 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 MM 1 1 E II II 1 1 II 1 1 1 1 
GGCCAGCTTCACTCTTGTCCTCATTGAGGAGCGAGTCACCCGAGCCAAGCACCTGCAGCT 


5514 


Db 


1824 


1883 


Qy 


5515 


TGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAA 

i i iii i i < i i I I I I I i I I I 1 l 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 
| | 1 II 1 II 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 

CATGGGGGGCCTGTCCCCCACCCTCTACTGGCTTGGCAACTTTCTCTGGGACATGTGTAA 


5574 


Db 


1884 


1943 


Qy 


5575 


CTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTA 
■ i i i i i i i it ii i i ii i i i i i i i i iii i i i iii ii 

II II 1 1 1 1 M M 1 1 II 1 II 1 1 1 II 1 1 1 1 1 1 1 II I 1 

CTACTTGGTGCCAGCATGCATCGTGGTGCTCATCTTTCTGGCCTTCCAGCAGAGGGCATA 


5634 


Db 


1944 


2003 


Qy 


5635 


CACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCAT 

. i I, i i i i i i i i i i i i ii ii i i i i i i i i ii it 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 IE 

TGTGGCCCCTGCCAACCTGCCTGCTCTCCTGCTGTTGCTACTACTGTATGGCTGGTCGAT 


5694 


Db 


2004 


2063 


Qy 


5695 


CACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTT 

i i i i i i i I 1 I i i i i i i i i l l III II 1 1 1 1 1 1 1 Mill III 1 

III II II 1 II 1 1 II 1 1 1 1 II 1 1 1 1 1 III II 1 1 1 1 1 1 1 Mill III 1 
CACACCGCTCATGTACCCAGCCTCCTTCTTCTTCTCCGTGCCCAGCACAGCCTATGTGGT 


5754 


Db 


2064 


2123 


Qy 


5755 


CCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACA 

I I 1 1 III II 1 1 1 1 1 II 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 

1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 11 1 1 1 1 M M M M M MM 1 
GCTCACCTGCATAAACCTCTTTATTGGCATCAATGGAAGCATGGCCACCTTTGTGCTTGA 


5814 


Db 


2124 


2183 


Qy 


5815 


GCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCT 

II 1 1 1 1 1 11 1 1 1 M 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 
GCTCTTC T C T GAT C AGAAGC T GC AG GAGGT GAG C C GGAT C T T GAAAC AG GT CT T C CT 


5874 


Db 


2184 


2240 


Qy 


5875 


CAT T T T C C C CAACT AC AAC C T G GG C CAC G G G CT CAT G GAG AT G GC CT ACAAC GAGT AC AT 

1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 Ml 

TATCTTCCCCCACTTCTGCTTGGGCCGGGGGCTCATTGACATGGTGCGGAACCAGGCCAT 


5934 


Db 


2241 


2300 


Qy 


5935 


CAAC GAGT AC T AC G C C AAG AT T G G C C AGT T T G AC AAG AT GAAGT C 

Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGCT GAT GCCTTTGAGCGCTTGGGTGAGAACTTCCTGTCAGGAGACAGGCAGTTCCAGTC 


5979 


Db 


2301 


2360 



598 0 CCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGT 6039 

II I I I I I I I I I I I II II I I I I I I I I I I I I I M 

2361 ACCCCT GCGCTGGGAGGT GGT CGGCAAGAACCT CTTGGCCATGGT GATACAGGGGCCCCT 2420 

6040 GGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCC 6099 

I I II I I I I I II I I I I I II I I I I I I I I II I I I 

2421 CTTCCTTCTCTTCACACTACTGCTGCAGCACCGAAGCCAACTCCTGCCACAGCCCAGGGT 24 80 

6100 TGTGTCT ACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGT 6156 

II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
2481 GAGGTCTCTGCCACTCCTGGGAGAGGAGGACGAGGATGTAGCCCGTGAACGGGAGCGGGT 2540 

6157 GCT C CGGGGAGACGC CGACAAT GACAT GGT CAAGATT GAGAAC CT GACCAAGGT CTACAA 6216 

I I I I I I I I I I I I II III II I I I I I I I I I I I I I I I I I 

2541 GGTCCAAGGAGCCACCCAGGGGGATGTGTTGGTGCTGAGGAACTTGACCAAGGTATACCG 2 600 

6217 GTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGG 6276 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

2 601 TGGGCAGAGGATG CCAGCTGTTGACCGCTTGTGCCTGGGGATTCCCCCTGG 2 651 

6277 CGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCT 6336 

M I I I II I I I I I I I I I I II II II II M M I I I I M M Ml I 

2652 TGAGTGTTTTGGGCTGCTGGGTGTGAATGGAGCAGGGAAGACGTCCACGTTTCGCATGGT 2711 

6337 GACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAA 6396 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

2712 GACGGGGGACACATTGGCCAGCAGGGGCGAGGCTGTGCTGGCAGGCCACAGCGTGGCCCG 2771 

6397 GGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGA 6456 

I I I I Mill II I I II I I II II I I II I I I I I I I I I I 

2772 GGAACCCAGTGCTGCGCACCTCAGCATGGGATACTGCCCTCAATCCGATGCCATCTTTGA 2831 

6457 CGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAA 6516 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I 

2 832 GCTGCTGACGGGCCGCGAGCACCTGGAGCTGCTTGCGCGCCTGCGCGGTGTCCCGGAGGC 2 8 91 

6517 GGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGA 6576 

II II I I I I III I I I I I I M I II I I I I I I I II I 

28 92 CCAGGTTGCCCAGACCGCTGGCTCGGGCCTGGCGCGTCTGGGACTCTCATGGTACGCAGA 2951 

6577 CAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCT 6636 

I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2952 CCGGCCTGCAGGCACCTACAGCGGAGGGAACAAACGCAAGCTGGCGACGGCCCTGGCGCT 3011 

6637 CAT T G G GT AC C C AG C C T T CAT C T T C C T G G AC GAG C C C AC C AC AG G CAT G G AC C C C AAG G C 6696 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3012 GGTTGGGGACCCAGCCGTGGTGTTTCTGGACGAGCCGACCACAGGCATGGACCCCAGCGC 3071 

6697 CCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTGCT 6756 

I I I I I I I I I I I I I I I I I II Mil I I I I I II I I I I I I I I I I 
3072 GCGGCGCTTCCTTTGGAACAGCCTTTTGGCCGTGGTGCGGGAGGGCCGTTCAGTGATGCT 3131 

6757 GACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAA 6816 

II II II I I I I I I I I I I I I I I II I I I I I I I I MM I II II I I II II I I II I I 
3132 CACCTCCCATAGCATGGAGGAGTGTGAAGCGCTCTGCTCGCGCCTGGCCATCATGGTGAA 3191 

6817 CGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGCTA 6876 



Db 3192 TGGGCGGTTCCGCTGCCTGGGCAGCCCGCAACATCTCAAGGGCAGATTCGCGGCGGGTCA 3251 

Qy 6877 CAT GAT C AC G G T G C G G AC C AAG AG C AG C C AG AGT G T G AAG G AC GTGGTGCGGTTCTT C AA 6936 

II I II Mill III II II III I I I I 

Db 32 52 CACACTGACCCTGCGG GTGCCCGCCGCAAGGTCCCAGCCGGCAGCGGCCTTCGTGGC 330 8 

Qy 6937 C C GCAACT T C C C GGAAGC C AT G C T CAAG GAG C G GC AC CACACAAAGGT GCAGT AC CAG CT 6996 

I I I I I I I I I I III III II I I I I I I I I I I 

Db 3309 GGCCGAGTTCCCTGGGGCGGAGCTGCGCGAGGCACATGGAGGCCGCCTGCGCTTCCAGCT 3368 

Qy 6997 CAAGTCG GAG C AC AT CTCGCTGGCC CAG GT GT T CAG CAAG AT G GAG C AG GT GT C T G G 7053 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3369 GCCGCCGGGAGGGCGCTGCGCCCTGGCGCGCGTCTTTGGAGAGCTGGCGGTGCACGGCGC 342 8 

Qy 7054 CGTGCTGGGCATCGAGGACTACTCGGT 7080 

III I I I I I I I I I I I I I I I 
Db 3429 AGAGCAC G GC GT GGAG GACT T T T C C GT 3455 



RESULT 3 

US-09-833-381-962 

; Sequence 962, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 

FILE REFERENCE: 5800-119 
; CURRENT APPLICATION NUMBER: US/ 09/ 8 33 , 38 1 
; CURRENT FILING DATE: 2001-04-11 
; PRIOR APPLICATION NUMBER: 09/516,448 
; PRIOR FILING DATE: 2000-02-29 
; NUMBER OF SEQ ID NOS : 2050 

; SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 962 

LENGTH: 2 07 5 
; TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 
; NAME/ KEY: misc_f eature 

LOCATION: (1)...(2075) 
; OTHER INFORMATION: n = A,T,C or G 
US-09-833-381-962 

Query Match 6.8%; Score 547; DB 4; Length 2075; 

Best Local Similarity 59.7%; Pred. No. 1.5e-94; 

Matches 1054; Conservative 0; Mismatches 686; Indels 26; Gaps 7; 

Qy 5407 GGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGT 5466 

I I I I II I I I I I I I I II I II I I I I I I I II I I I II I I I I I I I I I I I I 

Db 39 GGACGTCCTCGTCTCCATCTGTGTGGTCTTTGCCATGTCCTTTGTCCCGGCCAGCTTCAC 98 

Qy 5467 TGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTG 5526 

II I I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I 

Db 9 9 TCTTGTCCTCATTGAGGAGCGAGTCACCCGAGCCAAGCACCTGCAGCTCATGGGGGGCCT 158 



Qy 5527 CAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCC 558 6 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



159 



5587 



219 



| | | | I I M I I I I I I I I I I > I I I I I I I I I I I I I I I I I I I I I I I I 
GTCCCCCACCCTCTACTGGCTTGGCAACTTTCTCTGGGACATGTGTAACTACTTGGTGCC 



218 



CGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCAC 5646 

|| | | II I I I I I I II I I I I I I I II I I I I I I I 
AGCATGCATCGTGGTGCTCATCTTTCTGGCCTTCCAGCAGAGGGCATATGTGGCCCCTGC 27 8 



5647 CAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCAT 57 06 

I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

27 9 CAACCTGCCTGCTCTCCTGCTGTTGCTACTACTGTATGGCTGGTCGATCACACCGCTCAT 338 

5707 GTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCAT 57 66 

I I II I I I I I I II I I I I Ml I I I I I I I I I II I I I I I I I II 

339 GTACCCAGCCTCCTTCTTCTTCTCCGTGCCCAGCACAGCCTATGTGGTGCTCACCTGCAT 39 8 

57 67 CAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCA 582 6 

I I I II I I I I I II I I I I I I I I I I I I II I I I I It M II 

399 AAACCTCTTTATTGGCATCAATGGAAGCATGGCCACCTTTGTGCTTGAGCTCTTC TC 455 

5827 CGAC7^AGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAA 58 8 6 

II II I III III I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 56 TGATCAGAAGCTGCAGGAGGTGAGCCGGATCTTGAAACAGGTCTTCCTTATCTTCCCCCA 515 

5887 CTACAACCTGGGCCACGGGCT CAT GGAGATGGCCTACAACGAGTACAT CAACGAGTACTA 594 6 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I III II II 

516 CTTCTGCTTGGGCCGGGGGCTCATTGACATGGTGCGGAACCAGGCCATGGCTGATGCCTT 575 

5947 C GC C AAG AT T G G C C AGT T T GAC AAGAT GAAGT C C C C GT T C GAGT GG GAC AT T GT C AC C C G 6006 
I I I I I I I I I I I I I I I Mill I III I 

576 T GAG C G CT T GGGAG AC AGG C AGTTCCAGTCACCCCTGCGCTGGGAGGTGGTCGGCAA 632 

6007 CGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCA 6066 

II I I I I I I I I I I I I I I I II I I I I I I I I I II II 
633 GAACCTCTTGGCCATGGTGATACAGGGGCCCCTCTTCCTTCTCTTCACACTACTGCTGCA 692 

6067 GTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCT AC CAAG CCT GT GGAGGA 6123 

III II I I I I I I I I I I II I I I I I I I I I I I I I 

693 GCACCGAAGCCAACTCCTGCCACAGCCCAGGGTGAGGTCTCTGCCACTCCTGGGAGAGGA 752 

6124 T GAT GT GGACGT G G CC AGT GAGC GGC AGC GAGT GCT C C G GGGAGAC G C C GACAAT GAC AT 6183 
I I I I I I II I II I I I I I I I II I I I I I I I I I I I I I I I I II I 

753 GGAC GAGGAT GT AG C C C GT GAAC GGGAG C GGGT GGT C CAAGGAGCCAC C CAGGGGGAT GT 812 

6184 GGT CAAGAT T GAGAAC CT GAC CAAG GT CT ACAAGT C C C G GAAGAT T GGC C GT AT CCT GGC 6243 

II II I I I I I I I II I I I I I I I I III I I I I II 
813 GTTGGTGCTGAGGAACTTGACCAAGGTATACCGTGGGCAGA GGATGCCAGC 



863 



624 4 CGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAA 6303 

I I I I I I I I I I I I I II I I I I II I II I I I I I I I I I I I II I I I I I I I I 
864 TGTTGACCGCTTGTGCCTGGGGATTCCCCCTGGTGAGTGTTTTGCGCTGGTGGGGGCCAA 923 

6304 CGGTGCGGG CAAGAC C AG C AC CT T CAAGAT GCT GAC C G GC GAC GAG AG C AC GAC G G GG G G 6363 
I I I I I I I I I I II II I I I I I I I I I II I I I I II 

92 4 T GGAG CAGG GAAT AC GT C GAC GC T C C GCAT G GT GAC G GGG C AC AC ATT C T C C AC C AGAGA 983 

6364 CGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCT 6423 
I I I I I I III I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



984 CCAACCTGTGCTCCCACACCACTTATTGGGCACCTACTCCAGTGCAACACTCCTGCTCCT 1043 

6424 CGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCA 64 83 

I III I I III I I I I I I I I I I I I I II I I I I I 

1044 AT TAT TAT T C T C T T AAAC CAT T AC CAT C T T T AAAC T GAT G AC GGGCCGC GAG C AC C T G G A 1103 

6484 GCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGC 654 3 

I I II I I I I I I I I II III I II I I I I I I III 

1104 GCTGCTTGCGCGCCTGCCCGGTGTCCCGGAGGCCCAGGTTGCCCAGACCGCTGGCTCGGG 1163 

6544 T C T GGAGAAG C T G GAG C T GAC C AAGT AC GC AGAC AAGC C GGC T GG C AC CT AC AG C G G C GG 6603 

Mill I I I I II I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I 
1164 CCTGGCGCGTCTGGGACTCTCATGGTACGCAGACCGGCCTGCAGGCACCTACAGCGGAGG 1223 

6604 CAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCT 6663 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I Mill 
122 4 GAACAAACGCAAGCTGGCGACGGCCCTGGCGCTGGTTGGGTACCAAGCCGTGGTGTTTCT 12 83 

6664 GGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCT 6723 

I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I 
1284 GGACGAGCCGACCACAGGCATGGACCCCANCGCGCGGCGCTTCCTTTGGAACAGCCTTTT 1343 

6724 C GAC CT CAT CAAGAC AG GGC GT T C AGT GGT GC T GACAT C AC ACAG CAT G GAG - GAGT G C G 67 82 

III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1344 GGCCGTGGTGCGGAAGGGCCGTTCAGTGATGCTCACCTCCCATAGCATGGAGAGAGTGTG 14 03 

6783 AGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCA 6842 

I II I I I III I I I I II I I I I I I I I I I I I I I II I I I II III I I I I I I II 

1404 AAGCGCTCTGCTCGCGCCTAGCCATCATGGTGAATGGGCGGTTCCGCTGCATGGGCAGCC 14 63 

6843 T C CAGCAC CT GAAGAAC C GGT T T GGAGAT GGC TACAT GAT C AC GGT G C G GAC CAAGAGC A 6902 

II Mllll I I I I I I II III III I I I I I I II 
1464 AGCACATCCTCAAGGGCAGATTCGCGGCGGGTCACACACTGACCCTGCGG TGCCCA 1519 

6903 GCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCA 6962 

I II II III I I I I I I I I I I I I I III 

1520 CCGCAAGGTCCCAGCCGGCAGCGGCCTTCGTGGCGGCCGAGTTCCCTGGGTCGGAGCTGC 157 9 

6963 AG GAG C G G C AC C AC AC AAAG GT G C AGT AC C AG C T C AAGT C G GAG C AC AT CT C GCT G G 7019 

III I I III I I I I I I I III I II I I I I I II 

158 0 GCGAGGCACATGGAGGCCGCCTGCGCTTCCAGCTGCCGCCGGGAGGGCGCTGCGCCCTGG 1639 

7020 CCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGG 707 9 

II I I I I I I I I I I I I I III I I I I II I I I I I III 

164 0 CGCGCGTCTTTGGAGAGCTGGCGGTGCACGGCGCAGAGCACGGCGTGGAGGACTTTTCCG 1699 

708 0 T CAGCCAGACCACACT GGACAAT GTGTT CGTGAACTTTGCCAAGAAGCAGAGTGACAACC 7139 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II 
1700 T GAG C C AGAC GAT GC T G GAG GAG GT AT T CT T GT AC T T CT CCAAGG AC C AG G GGAAGGAC G 1759 

714 0 T G GAG C AG C AG GAG AC G GAG C C G C C A 7165 

III I I I I III III 

1760 AG GACAC C GAAG AG C AGAAG GAG GCA 17 85 



RESULT 4 

US-09-833-381-1079 



; Sequence 1079, Application US/09833381 

; Patent No. 6672186 

; GENERAL INFORMATION: 

; APPLICANT: Robison, Keith E. 

; TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 

FILE REFERENCE: 5800-119 
; CURRENT APPLICATION NUMBER: US/ 09/833,381 
; CURRENT FILING DATE: 2001-04-11 
; PRIOR APPLICATION NUMBER: 09/516,448 
; PRIOR FILING DATE: 2000-02-29 
; NUMBER OF SEQ ID NOS : 2 050 

SOFTWARE: FastSEQ for Windows Version 3.0 
; SEQ ID NO 1079 
LENGTH: 515 
TYPE : DNA 
; ORGANISM: Homo sapiens 
US-09-833-381-1079 

Query Match 5.9%; Score 476.8; DB 4; Length 515; 

Best Local Similarity 99.0%; Pred. No. 2e-81; 

Matches 511; Conservative 0; Mismatches 2; Indels 3; Gaps 3; 

Qy 435 GCCCGGGCACCTCGGGGAGCCACCTGGAC-AGATCCACAGTGTCTTCCTTCTCTCTGGAC 4 93 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I I I I I I I I I II I I I 
Db 2 GCCCCCGCACCTCGGGGAGCCACCTGGACAAGATCCACAGTGTCTTCCTTCTCTCTGGAC 61 

Qy 494 TCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCC 553 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 TCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCC 121 

Qy 554 AATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTG 613 

I I I II I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 122 AATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTG 181 

Qy 614 CTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCC 673 

I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I II I I I I I I I I I 
Db 182 CTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCC 241 

Qy 67 4 TGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCC 733 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I 
Db 242 TGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCC 301 

Qy 734 CTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTG 793 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 302 CTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTG 361 

Qy 794 CCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCT 853 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 362 CCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCT 421 

Qy 854 GCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTG 913 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I 
Db 422 GCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCT-CGGAACCAGCTGGACGTG 4 80 

Qy 914 GCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCC 949 

I II I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 481 G-CAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCC 515 



RESULT 5 

US-08-665-259-24 

Sequence 24, Application US/08665259 
Patent No. 6028173 
GENERAL INFORMATION: 

APPLICANT: Landes, Gregory M. 
APPLICANT: Burn, Timothy C. 
APPLICANT: Connors, Timothy D. 
APPLICANT: Dackowski, William R. 
APPLICANT: Van Raay, Terence J. 
APPLICANT: Klinger, Katherine W. 

TITLE OF INVENTION: NOVEL HUMAN CHROMOSOME 16 GENES, 

TITLE OF INVENTION: COMPOSITIONS, METHODS OF MAKING AND USING SAME 
NUMBER OF SEQUENCES: 73 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: GENZYME CORPORATION 
STREET: One Mountain Road 
CITY: Framingham 
STATE : Massachusetts 
COUNTRY: United States of America 
ZIP: 01701 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC- DOS/MS-DOS 
SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/665 , 259 
FILING DATE: 17-JUN-1996 
CLASSIFICATION: 435 
ATTORNEY/AGENT INFORMATION: 
NAME: Dugan, Deborah A. 
REGISTRATION NUMBER: 37,315 
REFERENCE/ DOCKET NUMBER: IG5-9.1 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (508) 872-8400 
TELEFAX: (508) 872-5415 
INFORMATION FOR SEQ ID NO: 24: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 5894 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 2.. 5053 
US-08-665-259-24 

Query Match 5.6%; Score 450.4; DB 3; Length 58 94; 

Best Local Similarity 57.9%; Pred. No. 3.5e-76; 

Matches 948; Conservative 0; Mismatches 606; Indels 84; Gaps 5; 

Qy 2 092 CGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCA 2151 

II I I I I I I I I I I I I I I III II I I I I I I I I II I III 



Db 664 CATCAAGAGGTTCCCGTACCCGCCGTTCATCGCAGACCCCTTCCTCGTGGCCATCCAGTA 723 

Qy 2152 CATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCA 2211 

I I I I I I I I I I I I I I I II I I I I I I I I II I II 

Db 72 4 CCAGCTGCCCCTGCTGCTGCTGCTCAGCTTCACCTACACCGCGCTCACCATTGCCCGTGC 783 

Qy 2212 CATCGTGGCGGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAA 2271 

I I I I I I I I I I I I I I M I I I II I I I III I I I I I I I I I I I 

Db 784 T GT C GT G C AG GAGAAG GAAAGGAG GCT GAAG GAGT AC AT GC GCAT GAT GGG G CT C AG C AG 843 

Qy 2272 CGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGAC 2331 

I I I I I I I I I I I II I I I I I I I I III I II I I I I I I I I 

Db 844 CTGGCTGCACTGGAGTGCCTGGTTCCTCTTGTTCTTCCTCTTCCTCCTCATCGCCGCCTC 903 

Qy 2332 AGCACTCACCGCCATCCT GAAGTACGGCCAGGTGCTTATGCACAG 2376 

I I I I III I II I I I I I I I I I 

Db 904 CTTCATGACCCTGCTCTTCTGTGTCAAGGTGAAGCCAAATGTAGCCGTGCTGTCCCGCAG 963 

Qy 2377 CCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTG 2436 

III III I I I I I I I II III I I llllll I I I I 

Db 964 CGACCCCTCCCTGGTGCTCGCCTTCCTGCTGTGCTTCGCCATCTCTACCATCTCCTTCAG 1023 

Qy 2437 CTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCAT 24 96 

I I I I I I II III I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1024 CTTCATGGTCAGCACCTTCTTCAGCAAAGCCAACATGGCAGCAGCCTTCGGAGGCTTCCT 1083 

Qy 2497 CTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGA 2556 

I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 1084 CTACTTCTTCACCTACATCCCCTACTTCTTCGTGGCCCCTCG GTACAA 1131 

Qy 2557 TAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCT 2616 

I I I I I llllll I I I I MM MM I I I I I I I 

Db 1132 CTGGATGACTCTGAGCCAGAAGCTCTGCTCCTGCCTCCTGTCTAATGTCGCCATGGCAAT 1191 

Qy 2 617 GGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTT 2 67 6 

II I I II I I I I I II I I I I I II I I I I I II I I II I I I I II 

Db 1192 G GGAGC C CAG CT CAT T G GGAAAT T T GAG GC GAAAGGCAT GGGC AT C CAGT G GC GAGAC CT 1251 

Qy 2677 CAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGAT 2736 

I II I I I II I I II I I I I I I III I II I I I I I 

Db 12 52 CCTGAGTCCCGTCAACGTGGACGACGACTTCTGCTTCGGGCAGGTGCTGGGGATGCTGCT 1311 

Qy 2737 GGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCAT 2796 

I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I II I I llllll 
Db 1312 GCTGGACTCTGTGCTCTATGGCCTGGTGACCTGGTACATGGAGGCCGTCTTCCCAGGGCA 1371 

Qy 2797 GTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGG 2 8 56 

I I I I I I I I I I I II I I I I II I I I I I I I I I I I M I II I 

Db 1372 GTTCGGCGTGCCTCAGCCCTGGTACTTCTTCATCATGCCCTCCTATTGGTGTGGGAAGCC 1431 

Qy 2857 GCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCAT 2916 

II I I I I I 

Db 14 32 AAGGGCGGTTGCAGG 1446 

Qy 2917 G GAG GAG G AC CAG GCCTGTGC CAT G GAG AG CCGGCGCTTT GAG GAGAC C C G T G G CAT G G A 2976 

I I I I I I II I I I I I I I I I I I II I II I I I I I 

Db 1447 GAAGGAG GAAGAAG AC AGT GAC C C C GAGAAAGCAC T C AGAAAC GAG TACTTTGA 1500 



Qy 2977 GGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAA 3036 

I I I I I I I I I I 1 II M I I IN I I I I I I I I I I 

Db 1501 AG C C GAGC C AGAG GAC CTGGTGGCGGG GAT CAAGAT CAAG C AC CT GT C CAAG GT GT T CAG 1560 

Qy 3037 GGACGACAAGAA GCTGGCCCT G AAC AAG C T GAG C C T G AAC C T C T AC G AG AAC C A 3090 

II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II 

Db 1561 GGTGGGAAATAAGGACAGGGCGGCCGTCAGAGACCTGAACCTCAACCTGTACGAGGGACA 1620 

Qy 3091 GGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGAC 3150 

II I II I I I I I I I II I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I 

Db 1621 GATCACCGTCCTGCTGGGCCACAACGGTGCCGGGAAGACCACCACCCTCTCCATGCTCAC 1680 

Qy 3151 CGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGA 3210 

I I I I I I I I I I I I II II I I I I I I I I I I I I I M I 

Db 1681 AGGT CTCTTTCCCCC C ACC AGT G GAC GG GC AT AC AT CAG C G GGT AT GAAAT T T C C CAG GA 17 4 0 

Qy 3211 GAT G GAT GAGAT C C G C AAGAAC CT G G GC AT GT GC C C G CAG C AC AAT GTGCTCTTT GAC C G 3270 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1741 CATGGTTCAGATCCGGAAGAGCCTGGGCCTGTGCCCGCAGCACGACATCCTGTTTGACAA 18 00 

Qy 3271 GCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGA 3330 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 
Db 1801 CTTGACAGTCGCAGAGCACCTTTATTTCTACGCCCAGCTGAAGGGCCTGTCACGTCAGAA 1860 

Qy 3331 GAT CCGCAGAGAGAT GGACAAGAT GAT CGAGGAC CT GGAGCT CTC CAACAAAC GGCACT C 3390 

I II III I I Mill I I III II I I I I I I I I I I 

Db 1861 GT GC CCT GAAGAAGT CAAGCAGAT GCT GC ACAT CAT C GGC CT GGAGGAC AAGT GGAACT C 1920 

Qy 3391 ACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGT 34 50 

III I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 1921 ACGGAGCCGCTTCCTGAGCGGGGGCATGAGGCGCAAGCTCTCCATCGGCATCGCCCTCAT 1980 

Qy 3451 GGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCG 3510 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I 

Db 1981 C GCAGG CT C CAAGGT GCT GAT AC T GGAC GAGC C CAC CT C GGGC AT GGAC GC CAT CT C CAG 204 0 

Qy 3511 CCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCAC 357 0 

I II I I I I I I I I I I I III I I I I I I I I I I II I I I I II I I I I I 

Db 2041 GAGG GC CAT C T GGGAT CTT CT T CAG C GG CAGAAAAGT GAC C GC AC CAT C GT GCT GAC CAC 2100 

Qy 3571 C CAC CAC AT G GAT GAG GCT GAC CTGCTTGGG GAC C G CAT T G C CAT CAT C T C C CAT G G G AA 3630 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I III I 
Db 2101 CCACTTCATGGACGAGGCTGACCTGCTGGGAGACCGCATCGCCATCATGGCCAAGGGGGA 2160 

Qy 3631 GCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCT 3690 

III I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 GCTGCAGTGCTGCGGGTCCTCGCTGTTCCTCAAGCAGAAATACGGTGCCGGCTATCACAT 2220 

Qy 3691 CACGCTGGTCAAGCGGCC 3708 

I I I I I I I I III III 
Db 2221 GACGCTGGTGAAGGAGCC 2238 



RESULT 6 

US-08-762-500-24 

; Sequence 24, Application US/08762500 



Patent No. 6030806 
GENERAL INFORMATION: 

APPLICANT: Landes, Gregory M. 
APPLICANT: Burn, Timothy C. 
APPLICANT: Connors, Timothy D. 
APPLICANT: Dackowski, William R. 
APPLICANT: Van Raay, Terence J. 
APPLICANT: Klinger, Katherine W. 

TITLE OF INVENTION: NOVEL HUMAN CHROMOSOME 16 GENES, 

TITLE OF INVENTION: COMPOSITIONS, METHODS OF MAKING AND USING SAME 
NUMBER OF SEQUENCES: 83 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: GENZYME CORPORATION 
STREET: One Mountain Road 
CITY: Framingham 
STATE: Massachusetts 
COUNTRY: United States of America 
ZIP: 01701 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/ 08/7 62 , 50 0 
FILING DATE: 09-DEC-1996 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/665,259 
FILING DATE: 17-JUN-1996 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/US96/ 10469 
FILING DATE: 17-JUN-1996 
ATTORNEY/AGENT INFORMATION: 
NAME: Dugan, Deborah A. 
REGISTRATION NUMBER: 37,315 
REFERENCE/DOCKET NUMBER: IG5-9.3 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (508) 872-8400 
TELEFAX: (508) 872-5415 
INFORMATION FOR SEQ ID NO: 24: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 5894 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME/KEY: CDS 
LOCATION: 2. . 5053 
US-08-762-500-24 

Query Match 5.6%; Score 450.4; DB 3; Length 5894; 

Best Local Similarity 57.9%; Pred. No. 3.5e-76; 

Matches 948; Conservative 0; Mismatches 606; Indels 84; Gaps 5; 



Qy 



2092 CGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCA 2151 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



664 



II I I I I I I I I I I I I I I III II I I I I I I I I I II III 

CATCAAGAGGTTCCCGTACCCGCCGTTCATCGCAGACCCCTTCCTCGTGGCCATCCAGTA 723 



2152 CATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCA 2211 
I I I I I I I I I I I I I I I II I I I I I I I I || I || 

724 CCAGCTGCCCCTGCTGCTGCTGCTCAGCTTCACCTACACCGCGCTCACCATTGCCCGTGC 7 83 

2212 CAT C GT GGCGGAGAAGGAGCAC CGGCT CAAGGAGGT GAT GAAGAC CAT GGGC CT GAACAA 2271 
1 I I I I I I I II I I I I I I I I I I I I I I III I I I I I I I I I I I 

7 84 T GT CGT GCAGGAGAAGGAAAGGAG G C T GAAG GAGT AC AT G C GC AT GAT G GGG CT C AGCAG 843 

2272 CGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGAC 2331 
I I I I I I I I I I I I II I I I I I I I III I II I I II II I I 

84 4 CTGGCTGCACTGGAGTGCCTGGTTCCTCTTGTTCTTCCTCTTCCTCCTCATCGCCGCCTC 903 

2332 AGCACTCACCGCCATCCT GAAGT AC GGC C AG GT G CT T AT G C ACAG 2376 

I I I I II I I II I I I I I I Ml 

904 CTTCATGACCCTGCTCTTCTGTGTCAAGGTGAAGCCAAATGTAGCCGTGCTGTCCCGCAG 963 

237 7 CCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTG 2436 
III II I I I I I I I I I I I I I I I I I I I I I I I I I 

964 CGACCCCTCCCTGGTGCTCGCCTTCCTGCTGTGCTTCGCCATCTCTACCATCTCCTTCAG 1023 

2437 CTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCAT 24 96 

I I I I I I I I III I I I I I I I I I I I I I II I I I I I I I I I I I 
1024 CTTCATGGTCAGCACCTTCTTCAGCAAAGCCAACATGGCAGCAGCCTTCGGAGGCTTCCT 1083 

2497 CT ACT T C CT GAGCT AC GT G C C CT AC AT GT AC GT G GC GAT C C GAGAG GAG GT GGC GC AT GA 2556 

II I I I I I I I I I II I I I I II I I I I I I I I I II II I 
1084 CTACTTCTTCACCTACATCCCCTACTTCTTCGTGGCCCCTCG GTACAA 1131 

2 557 TAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCT 2 616 

I I I I I I I I I I I I I I I I I I I I I I I I III I I I 

1132 CTGGATGACTCTGAGCCAGAAGCTCTGCTCCTGCCTCCTGTCTAATGTCGCCATGGCAAT 1191 

2 617 GGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTT 2676 

III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
1192 GGGAGCCCAGCTCATTGGGAAATTTGAGGCGAAAGGCATGGGCATCCAGTGGCGAGACCT 1251 

2677 CAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGAT 273 6 
I II III I I t I I I I I I III III I I I I I I I I 

CCTGAGTCCCGTCAACGTGGACGACGACTTCTGCTTCGGGCAGGTGCTGGGGATGCTGCT 1311 



1252 



2737 



2796 



GGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCAT 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II II 
1312 GCTGGACTCTGTGCTCTATGGCCTGGTGACCTGGTACATGGAGGCCGTCTTCCCAGGGCA 1371 

2 7 97 GTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGG 2856 

I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I III 

1372 GTTCGGCGTGCCTCAGCCCTGGTACTTCTTCATCATGCCCTCCTATTGGTGTGGGAAGCC 1431 

2 857 GCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCAT 2916 
I I I I II I 

1432 AAGGGCGGTTGCAGG 144 6 

2 917 GGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGA 2 97 6 
I I I I I I I I I I I I I I I I I I I II I I I I I I I I 



Db 1447 GAAGGAG GAAGAAGAC AGT GAC C C C GAGAAAG CAC T C AGAAAC GAG TACTTTGA 1500 

Qy 2 977 GGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAA 3036 

I I I I I I I I I I I II II I I I I I I I I I I I I I I I 

Db 1501 AG C C GAGC C AGAGGAC C T G GT G G C GG GGAT CAAGAT C AAGCAC CT GT C CAAGGT GT T C AG 1560 

Qy 3037 GGACGACAAGAA GCT GGC C CT GAACAAGCT GAGC CT GAAC CT CT AC GAGAACC A 3090 

II I I I I I I I I I I I I I I I II I II I I I I I I I I II I II 

Db 1561 GGTGGGAAATAAGGACAGGGCGGCCGTCAGAGACCTGAACCTCAACCTGTACGAGGGACA 1620 

Qy 3091 GGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGAC 3150 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GATCACCGTCCTGCTGGGCCACAACGGTGCCGGGAAGACCACCACCCTCTCCATGCTCAC 1680 

Qy 3151 CGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGA 3210 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I III 

Db 1681 AGGTCTCTTTCCCCCCACCAGTGGACGGGCATACATCAGCGGGTATGAAATTTCCCAGGA 1740 

Qy 3211 GAT G GAT GAGAT C C GC AAGAAC CT GGGC AT GT G CC C GC AGCACAAT GTGCTCTTT GAC C G 3270 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I II I I I 
Db 1741 CAT GGTT C AGAT CC GGAAGAG CCTGGGCCTGTGCCCG C AGCAC GAC AT C CT GT T T GACAA 1800 

Qy 3271 GCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGA 3330 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 1801 CT T GAC AGT C G C AGAG C AC CT T T ATT T CT AC GC C C AG CT GAAGGGC CT GT CAC GT CAGAA 1860 

Qy 3331 GAT C C GC AGAGAGAT GGACAAGAT GAT C GAGGACCT GGAGCT CT C CAACAAAC G GCACT C 3390 

I II III I I II I I I I I III II I I I I I I I I I I 

Db 1861 GT G C C CT GAAGAAGT CAAGC AGAT GCT G CAC AT CAT C G GC C T GGAG G ACAAGT GGAACT C 1920 

Qy 3391 ACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGT 3450 

III I II I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I 

Db 1921 ACGGAGCCGCTTCCTGAGCGGGGGCATGAGGCGCAAGCTCTCCATCGGCATCGCCCTCAT 1980 

Qy 3451 GGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCG 3510 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 1981 CGCAGGCTCCAAGGTGCTGATACTGGACGAGCCCACCTCGGGCATGGACGCCATCTCCAG 204 0 

Qy 3511 CCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCAC 3570 

I I I II I I I I I I I I I III I I I I I I I I I I I I I I I I I I I II I I 

Db 2041 GAGGG C CAT C T GGGAT CTT CT T C AGC GGC AGAAAAGT GAC C G CAC CAT C GT GCT GAC CAC 2100 

Qy 3571 C CAC CAC AT G GAT GAG GCT GAC CT GC TT GG G GAC C GC ATT GC CAT CAT CT CC C AT GGGAA 3630 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CCACTTCATGGACGAGGCTGACCTGCTGGGAGACCGCATCGCCATCATGGCCAAGGGGGA 2160 

Qy 3631 GCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCT 3690 

III I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2161 GCTGCAGTGCTGCGGGTCCTCGCTGTTCCTCAAGCAGAAATACGGTGCCGGCTATCACAT 2220 

Qy 3691 CACGCTGGTCAAGCGGCC 3708 

I I I I I I I I I I I II I 
Db 2221 GAC G C T G GT GAAGGAGC C 2238 



RESULT 7 

US-08-762-500-74 



Sequence 74, Application US/08762500 
Patent No. 6030806 
GENERAL INFORMATION: 

APPLICANT: Landes, Gregory M. 
APPLICANT: Burn, Timothy C. 
APPLICANT: Connors, Timothy D. 
APPLICANT: Dackowski, William R. 
APPLICANT: Van Raay, Terence J. 
APPLICANT: Klinger, Katherine W. 

TITLE OF INVENTION: NOVEL HUMAN CHROMOSOME 16 GENES, 

TITLE OF INVENTION: COMPOSITIONS, METHODS OF MAKING AND USING SAME 
NUMBER OF SEQUENCES : 83 
CORRESPONDENCE ADDRESS: 

ADDRESSEE: GENZYME CORPORATION 
STREET: One Mountain Road 
CITY: Framingham 
STATE : Massachusetts 
COUNTRY: United States of America 
ZIP: 01701 
COMPUTER READABLE FORM: 

MEDIUM TYPE: Floppy disk 
COMPUTER: IBM PC compatible 
OPERATING SYSTEM: PC-DOS/MS-DOS 

SOFTWARE: Patentln Release #1.0, Version #1.30 
CURRENT APPLICATION DATA: 

APPLICATION NUMBER: US/08/7 62,500 
FILING DATE: 09-DEC-1996 
CLASSIFICATION: 435 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: US 08/665,259 
FILING DATE: 17-JUN-1996 
PRIOR APPLICATION DATA: 

APPLICATION NUMBER: PCT/US96/ 10469 
FILING DATE: 17-JUN-1996 
ATTORNEY/AGENT INFORMATION: 
NAME: Dugan, Deborah A. 
REGISTRATION NUMBER: 37,315 
REFERENCE/DOCKET NUMBER: IG5-9.3 
TELECOMMUNICATION INFORMATION: 
TELEPHONE: (508) 872-8400 
TELEFAX: (508) 872-5415 
INFORMATION FOR SEQ ID NO: 74: 
SEQUENCE CHARACTERISTICS: 
LENGTH: 6525 base pairs 
TYPE: nucleic acid 
STRANDEDNESS : single 
TOPOLOGY: linear 
MOLECULE TYPE: cDNA 
FEATURE : 

NAME/ KEY: CDS 
LOCATION: 573. .5684 
US-08-762-500-74 



Query Match 5.6%; Score 450.4; DB 3; Length 6525; 

Best Local Similarity 57.9%; Pred. No. 3.6e-76; 

Matches 948; Conservative 0; Mismatches 606; Indels 84; Gaps 



5; 



Qy 2 092 CGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCA 2151 

II I I I I I I I I I I I II I III II I I II I I I I I I I II I 

Db 12 95 CATCAAGAGGTTCCCGTACCCGCCGTTCATCGCAGACCCCTTCCTCGTGGCCATCCAGTA 1354 

Qy 2152 CATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCA 2211 

I I I II I I I I I I II II II I I I I I I I I II I || 

Db 1355 CCAGCTGCCCCTGCTGCTGCTGCTCAGCTTCACCTACACCGCGCTCACCATTGCCCGTGC 1414 

Qy 2212 CAT C GT GGCGGAGAAGGAGCAC C GGCT CAAGGAGGT GAT GAAGAC CAT GGGC CT GAACAA 2271 

I I I I I I I I I I I I I I I I I I I I I I I I III I I II I I I I I I I 

Db 1415 T GT C GT G C AGGAGAAG GAAAG GAG G C T GAAG GAGT ACAT G CGC AT GAT GGGGCT C AGCAG 1474 

Qy 2272 CGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGAC 2331 

I I I I I I I I I I I I I I I I I I I I I III I II I I I I I I I I 

Db 1475 CTGGCTGCACTGGAGTGCCTGGTTCCTCTTGTTCTTCCTCTTCCTCCTCATCGCCGCCTC 1534 

Qy 2332 AGCACTCACCGCCATCCT GAAGT AC GGCC AGGT GCTT AT GCACAG 2376 

I I I I II I I II I I I I I I I II 

Db 1535 CTTCATGACCCTGCTCTTCTGTGTCAAGGTGAAGCCAAATGTAGCCGTGCTGTCCCGCAG 1594 

Qy 2377 CCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTG 2436 

III II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1595 CGACCCCTCCCTGGTGCTCGCCTTCCTGCTGTGCTTCGCCATCTCTACCATCTCCTTCAG 1654 

Qy 2437 CTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCAT 2496 

II I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1655 CTTCATGGTCAGCACCTTCTTCAGCAAAGCCAACATGGCAGCAGCCTTCGGAGGCTTCCT 1714 

Qy 24 97 CTACTTCCT GAG C T AC G T G C C C T AC AT G T AC GT G G C GAT C C GAG AG GAG GT G G C G CAT G A 2556 

I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I 

Db 1715 CTACTTCTTCACCTACATCCCCTACTTCTTCGTGGCCCCTCG GTACAA 1762 

Qy 2557 TAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCT 2616 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

Db 17 63 CTGGATGACTCTGAGCCAGAAGCTCTGCTCCTGCCTCCTGTCTAATGTCGCCATGGCAAT 1822 

Qy 2 617 GGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTT 2 67 6 

III I II I I I I I II I I I I I I I I I II II I I I I I II I I II 

Db 1823 GGGAGCCCAGCTCATTGGGAAATTTGAGGCGAAAGGCATGGGCATCCAGTGGCGAGACCT 1882 

Qy 2677 CAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTGAT 2736 

I II I I I I I I I I I I I I I I I III I I I I I I I I 

Db 1883 CCTGAGTCCCGTCAACGTGGACGACGACTTCTGCTTCGGGCAGGTGCTGGGGATGCTGCT 1942 

Qy 27 37 GGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCAT 2 7 96 

I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1943 GCTGGACTCTGTGCTCTATGGCCTGGTGACCTGGTACATGGAGGCCGTCTTCCCAGGGCA 2002 

Qy 2797 GTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGG 2856 

I I I I I II II I I I I I I I I II I II I I I I I I I I I I I III 

Db 2 0 03 GTTCGGCGTGCCTCAGCCCTGGTACTTCTTCATCATGCCCTCCTATTGGTGTGGGAAGCC 2062 

Qy 2857 GCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCAT 2916 

I I I I I I I 

Db 2063 AAGGGCGGTTGCAGG 2077 



Qy 



2917 GGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGA 297 6 



2 07 8 GAAGGAGGAAGAAGACAGT GAC C CC GAGAAAGC ACT CAGAAACG AG TACTTTGA 2131 

2 977 GGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAA 3036 

I I I I I I I I I I I II II I I III I I I I I I I I I I 

2132 AGCCGAGCCAGAGGACCTGGTGGCGGGGATCAAGATCAAGCACCTGTCCAAGGTGTTCAG 2191 

3037 GGAC GACAAGAA GCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCA 3090 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2192 GGT GG GAAAT AAG GAC AGG GC GG C C GT C AGAGAC CT GAAC CT CAAC CT GT AC GAG G GAC A 2251 

3091 GGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGAC 3150 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2252 GATCACCGTCCTGCTGGGCCACAACGGTGCCGGGAAGACCACCACCCTCTCCATGCTCAC 2311 

3151 CGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGA 3210 

II II II II II II II II I I I I I I I I I I I I I I III 
2312 AGGTCTCTTTCCCCCCACCAGTGGACGGGCATACATCAGCGGGTATGAAATTTCCCAGGA 2371 

3211 GAT GGAT GAGAT CCGCAAGAACCT GGGCAT GT GC CC GCAGCACAAT GTGCT CTTT GACC G 3270 

MM I I I I I II I II I I II I I I II I I I I I I I I I I II II I I II II II I I 
2372 CAT G GT T CAGAT C C G GAAGAG CCTGGGCCTGTGCCC GC AGC AC GAC AT C CT GT T T GAC AA 2431 

3271 GCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGA 3330 

I I I I I I II II I I I I I II I I I I I II I I II II I I I I III 
2432 CTTGACAGTCGCAGAGCACCTTTATTTCTACGCCCAGCTGAAGGGCCTGTCACGTCAGAA 24 91 

3331 GAT C CGCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT C CAACAAACGGCACT C 3390 

I II III I I I I I II I I III M I II I II M I I 

2492 GT GC C CT GAAGAAGT C AAG CAGAT G C T GC AC AT CAT C GGC C T G GAGGACAAGT GGAACT C 2551 

3391 ACTGGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGT 3450 

III I II II I II II I I II II I II I I I I I I I I I I II I I I I I 
2552 ACGGAGCCGCTTCCTGAGCGGGGGCATGAGGCGCAAGCTCTCCATCGGCATCGCCCTCAT 2611 

3451 GGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCG 3510 

I I II II I I I I I II II I I II I I II I II II I II I M II II I 

2 612 CGCAGGCTCCAAGGTGCTGATACTGGACGAGCCCACCTC GGGCAT GGAC GCCATCTCC AG 2671 

3511 CCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCAC 3570 

I II II I M II II II III I I II I I I I II I I I I I I I M I I I I 

2 672 GAGGGCCATCTGGGATCTTCTTCAGCGGCAGAAAAGTGACCGCACCATCGTGCTGACCAC 2731 

3571 C C AC C AC AT GGAT GAGGCT GAC C T G CTT G GG GAC CGCAT T GC C AT CAT C T C C CAT G G GAA 3630 

I I I I I I I I II I I I I I II I I I I I I I II I I I I I II I I I II I II I II I III I 
2732 CCACTTCATGGACGAGGCTGACCTGCTGGGAGACCGCATCGCCATCATGGCCAAGGGGGA 2791 

3631 GCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCT 3690 

III I I I I II I I II I II I I I I I I I I II II I I I I I I I I I I M I I I 
2792 GCTGCAGTGCTGCGGGTCCTCGCTGTTCCTCAAGCAGAAATACGGTGCCGGCTATCACAT 2851 

3691 CACGCTGGTCAAGCGGCC 37 08 

I I I I II II I II III 
2852 GACGCTGGTGAAGGAGCC 2869 



US-09-833-381-1078 

Sequence 1078, Application US/09833381 
Patent No. 6672186 
GENERAL INFORMATION: 
APPLICANT: Robison, Keith E. 

TITLE OF INVENTION: No. 6672186el Nucleic Acid and Protein Homologs 
FILE REFERENCE: 5800-119 

CURRENT APPLICATION NUMBER: US/ 09/ 833 , 38 1 
CURRENT FILING DATE: 2001-04-11 
PRIOR APPLICATION NUMBER: 09/516,448 
PRIOR FILING DATE: 2000-02-29 
NUMBER OF SEQ ID NOS : 2 050 

SOFTWARE : FastSEQ for Windows Version 3.0 
SEQ ID NO 1078 
LENGTH: 506 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-09-833-381-1078 

Query Match 5.2%; Score 416.2; DB 4; Length 506; 

Best Local Similarity 98.9%; Pred. No. 5.7e-70; 

Matches 440; Conservative 0; Mismatches 3; Indels 2; Gaps 2; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 121 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 122 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 181 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 180 

I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 182 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCTACAGAAGAAGCCCACCAT 241 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACAC-AGCGGCGCCCCTGACGTCTGCCGGCATCCTGC 239 

I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 242 CTCCGTGAAGGAAGTCTCCTTCTACACAAGCGGCGCCCCTGACGTCTGCCGGCATCCTGC 301 

Qy 240 CTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACG 2 99 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I II I 
Db 302 CTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACG 361 

Qy 300 CCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACC 359 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 362 CCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACC 421 

Qy 3 60 TGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATC-TG 418 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II 

Db 422 TGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTTG 4 81 

Qy 419 GAGGCCCTCAGTGCGGGCCCGGGCA 443 

I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 82 GAGGCCCTTAGTGCGGGCCCGGGCA 506 



RESULT 9 



US-09-252-991A-4588/C 

; Sequence 4588, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 

FILE REFERENCE: 107196.136 
; CURRENT APPLICATION NUMBER: US/09/252, 991A 
; CURRENT FILING DATE: 1999-02-18 
; PRIOR APPLICATION NUMBER: US 60/074,788 
; PRIOR FILING DATE: 1998-02-18 
; PRIOR APPLICATION NUMBER: US 60/094,190 

PRIOR FILING DATE: 1998-07-27 
; NUMBER OF SEQ ID NOS : 33142 
; SEQ ID NO 4588 
; LENGTH: 999 
; TYPE: DNA 

; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-458 8 

Query Match 1.7%; Score 139.2; DB 4; Length 999; 

Best Local Similarity 52.6%; Pred. No. 1.6e-17; 

Matches 32 8; Conservative 0; Mismatches 2 93; Indels 3; Gaps 1; 

Qy 3050 CTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGC 3109 

I II I I I I I I I I I I I I I I I III I I I I I I I I I I I I 

Db 942 CAGGCCCTCAAGGGCATCGACCTGGACGTCGCCGAAGGTGATTTCTTCGCCTTGCTCGGC 883 

Qy 3110 C AC AAC GGGGCGGG C AAG AC C AC C AC CAT GT C CAT C C T G AC CGGCCTGTTCCCTC C AAC G 3169 

I II I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I II 

Db 882 C C CAACG GC G C GGGCAAGT C C AC C AC CAT C GGGAT T CT CT C GACC CT G GT GAACAAGAC C 823 

Qy 317 0 TCGGGTTCCGC C AC CAT C T AC G G G C AC G AC AT C C G C AC G GAG AT G GAT GAG AT C C G C AAG 322 9 

I I I I I I I I I I I I I I I I I I I I I II I I I II I II 
Db 822 AGCGGTTCGGTCTCGGTGTTCGGCCACGACCTCGACAAGGACCCGGCCGGCCTCAAGCGT 763 

Qy 3230 AACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACAC 3289 

I I I II I I I I I I I I I I II I I I I I II I 

Db 7 62 TGCCTTGGCGTGGTGCCGCAGGAGTTCAACTTCAACCAGTTCGAGAAGGTCTTCGACATC 703 

Qy 32 90 CT CT G GT T CT ACT C AC G GC T CAAGAG CAT GGCT CAG GAGGAGAT C C G C AGAGAGAT GGAC 334 9 

I I I I I I I I I I I I I I III I II 

Db 7 02 GTCGTGACCCAGGCCGGCTACTACGGCATCCCGGCGAAGATCGCCAAGGAGCGCGCCGAG 64 3 

Qy 3350 AAGAT GAT C GAG GAC C T G GAG C T CT C CAACAAAC GG CACT CAC T GGT G C AGAC AT T GT C G 3409 



Db 



642 




583 



3410 



GGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATC 



3469 



Db 



582 




523 



3470 



ATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTC 



3529 



Db 



522 




463 



Qy 



3530 



ATCCTGAA GT ACAAG C CAGGC C G C AC CAT CCTTCTGTC C AC C C AC C AC AT GGAT GAG 358 6 



Db 



462 



C T CAC AGAAC T C AAC C AGGAAG G CAT CAGCAT CAT C CT CAC C AC C CACT AC CT G GAAGAG 403 



Qy 



3587 



GCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGC 364 6 




Db 



402 



GC G GAGC AG CTCTGCCG CAAC AT T G C CAT CAT C GACCAC G G C GAGAT C GT G C AGAAC AC C 343 



Qy 



3647 



TCCCCGCTCTTCCTCAAGGGCACC 3 670 



Db 



342 



AGCATGCGCGACCTGCTGATGACC 319 



RESULT 10 

US-09-252-991A-4266 

; Sequence 4266, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al. 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252 , 991A 
; CURRENT FILING DATE: 1999-02-18 
; PRIOR APPLICATION NUMBER: US 60/074,788 
; PRIOR FILING DATE: 1998-02-18 
; PRIOR APPLICATION NUMBER: US 60/094,190 
; PRIOR FILING DATE: 1998-07-27 
; NUMBER OF SEQ ID NOS : 33142 
; SEQ ID NO 4266 
LENGTH: 1008 
; TYPE : DNA 

; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-4266 

Query Match 1.7%; Score 139.2; DB 4; Length 1008; 

Best Local Similarity 52.6%; Pred. No. 1.6e-17; 

Matches 328; Conservative 0; Mismatches 293; Indels 3; Gaps 1; 

Qy 3 050 CTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGC 3109 

I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I 

Db 130 CAGGCCCTCAAGGGCATCGACCTGGACGTCGCCGAAGGTGATTTCTTCGCCTTGCTCGGC 189 

Qy 3110 CACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACG 3169 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 190 CCCAACGGCGCGGGCAAGTCCACCACCATCGGGATTCTCTCGACCCTGGTGAACAAGACC 24 9 

Qy 3170 TCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATGGATGAGATCCGCAAG 3229 

I I I I I I I I I I I I I II I I I I I I I I I I I II I II 
Db 250 AGCGGTTCGGTCTCGGTGTTCGGCCACGACCTCGACAAGGACCCGGCCGGCCTCAAGCGT 309 

Qy 3230 AACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACAC 3289 

I I I I I I I I I I I I I I I II I I Ml II I 

Db 310 TGCCTTGGCGTGGTGCCGCAGGAGTTCAACTTCAACCAGTTCGAGAAGGTCTTCGACATC 369 



Qy 3290 CTCTGGTTC T AC T C ACGGCT C AAGAGC AT G G CT CAG GAGGAGAT C C GC AGAGAGAT G GAC 3349 

I I I I I I I I I I I I I I III I II 

Db 37 0 GTCGTGACCCAGGCCGGCTACTACGGCATCCCGGCGAAGATCGCCAAGGAGCGCGCCGAG 42 9 

Qy 3350 AAGAT GAT C GAG GAC CT G G AGC T C T C C AAC AAAC GGC AC T CAC T G GT GC AGACAT T GT C G 34 09 

I I I M I III I I I I I I II I I I I I III 

Db 430 CGCTACCTGACCCAACT GGGCCT GT GGGACAAGCGCAACGAAGCCT CGCGGAT GCT CTCC 48 9 

Qy 3410 GGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATC 34 69 

I I I I I I I I I I I I I I II I Ml III III I I I I I I 

Db 490 GGCGGCATGAAGCGGCGCCTGATGATCGCCCGCGCACTGGTCCACCAGCCGCGCCTGCTG 549 

Qy 3470 ATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTC 3529 

I I I I I I I I I I I II I I II I I I II I I I I I I I I I I I III 

Db 550 ATCCTCGACGAGCCCACCGCCGGGGTCGACATCGAGCTGCGTCGTTCGATGTGGAGCTTC 609 

Qy 3530 ATCCTGAA GT AC AAG C CAG G C C G CAC CAT CCTTCTGTC CAC C CAC CAC AT G GAT GAG 3586 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 

Db 610 CT C AC AGAACT CAAC CAGGAAGG C AT CAG CAT CAT C CT CAC CAC CC ACT AC CT GGAAGAG 669 

Qy 3587 GCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGC 3646 

I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 670 GC GGAGC AG CT CT GC CGCAAC AT T G C CAT CAT C GAC CACGGC G AGAT C GT GC AGAAC AC C 729 

Qy 3647 TCCCCGCTCTTCCTCAAGGGCACC 367 0 

I III III I II I 
Db 730 AGCATGCGCGACCTGCTGATGACC 7 53 



RESULT 11 

US-09-252-991A-4198 

; Sequence 4198, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252 , 991A 

; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

; PRIOR FILING DATE: 1998-02-18 

; PRIOR APPLICATION NUMBER: US 60/094,190 

; PRIOR FILING DATE: 1998-07-27 

; NUMBER OF SEQ ID NOS : 33142 

; SEQ ID NO 4198 

; LENGTH: 1614 

TYPE: DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-4198 

Query Match 1.6%; Score 130; DB 4; Length 1614; 

Best Local Similarity 52.8%; Pred. No. le-15; 

Matches 305; Conservative 0; Mismatches 27 0; Indels 3; Gaps 1; 



Qy 3096 TCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCC 3155 



II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I ! II 

Db 6 TCGCCTTGCTCGGCCCCAACGGCGCGGGCAAGTCCACCACCATCGGGATTCTCTCGACCC 65 

Qy 3156 TGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATGG 3215 

III II I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 66 TGGTGAACAAGACCAGCGGTTCGGTCTCGGTGTTCGGCCACGACCTCGACAAGGACCCGG 125 

Qy 3216 AT GAG AT C C G C AAG AAC C T G G G CAT G T G C C C G C AG C AC AAT GTGCTCTTT G AC C G G C T C A 3275 

III I I I I I I I I II I I I I I || I I 

Db 126 CCGGCCTCAAGCGTTGCCTTGGCGTGGTGCCGCAGGAGTTCAACTTCAACCAGTTCGAGA 185 

Qy 3276 CGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGAGATCC 3335 

III II I I I I I I I I I I I I I I I III I 

Db 186 AGGT CT T C GAC AT C GT C GT G AC C C AGG C CG GCT ACT ACGG C AT CC C GGC GAAGAT C G C C A 245 

Qy 3336 G C AGAGAGAT GGACAAGAT GAT C GAGGACCT GGAGCT CT C CAACAAAC GGC ACT CACT G G 3395 

II I I I I I I I I I I I I I I I I I I 

Db 246 AGGAGCGCGCCGAGCGCTACCTGACCCAACTGGGCCTGTGGGACAAGCGCAACGAAGCCT 305 

Qy 3396 TGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCG 3455 

I I I I I I I I I I I I I I I I I I I I III I I I I III III I 

Db 306 CGCGGATGCTCTCCGGCGGCATGAAGCGGCGCCTGATGATCGCCCGCGCACTGGTCCACC 365 

Qy 3456 GCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCG 3515 

I I I I I I I I I I I I I I I 1 I II I I I I II I I I I I II I I I I I 

Db 3 66 AGCCGCGCCTGCTGATCCTCGACGAGCCCACCGCCGGGGTCGACATCGAGCTGCGTCGTT 42 5 

Qy 3516 C CAT C T GG GAC CT CAT C CT GAAGT ACAAGCCAGGCCGCACCATCCTTCTGTCCACCC 3572 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 426 C GAT GT GGAG CT T C CT C AC AGAACT CAAC C AG GAAG G CAT C AGC AT CAT C CT CACCAC C C 485 

Qy 3573 ACCACAT GGAT GAGGCT GAC CT GCTT GGGGAC C GCAT T GC CAT CAT CT CCCAT GGGAAGC 3632 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4 86 ACT AC CT G GAAGAG GCG GAGC AGCT C T GC C GCAACAT TGC C AT CAT C GAC CACGGC GAGA 54 5 

Qy 3633 TCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACC 3670 

III I I I I I I I I I I II I 

Db 546 T C GT G C AGAAC AC C AGC AT G C G C GAC CT GCT GAT GAC C 583 



RESULT 12 
US-09-103-840A-2 

; Sequence 2, Application US/09103840A 

; Patent No. 6294328 

; GENERAL INFORMATION: 

; APPLICANT: FLEISCHMAN, Robert D. 

; APPLICANT: WHITE, Owen R. 

; APPLICANT: FRASER, Claire M. 

; APPLICANT: VENTER, John C. 

; TITLE OF INVENTION: DNA SEQUENCES FOR STRAIN ANALYSIS IN MYCOBACTERIUM 

; TITLE OF INVENTION: TUBERCULOSIS 

; FILE REFERENCE: 24366-20007.00 

; CURRENT APPLICATION NUMBER: US/09/103, 840A 

; CURRENT FILING DATE: 1998-06-24 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: Patentln Ver. 2.1 

; SEQ ID NO 2 



; LENGTH: 4403765 
; TYPE: DNA 

; ORGANISM: Mycobacterium tuberculosis 
FEATURE : 

OTHER INFORMATION: CDC 1551 

OTHER INFORMATION: "n" bases at various positions throughout the sequence 
OTHER INFORMATION: represent a, t, c or g 
US-09-103-840A-2 



Query Match 1.6%; Score 129.2; DB 3; Length 4403765; 

Best Local Similarity 49.7%; Pred. No. 9.8e-15; 

Matches 357; Conservative 0; Mismatches 358; Indels 3; Gaps 1; 

Qy 2 974 GGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTA 3033 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3266477 GGAGGAT C GGAT GC G C AAC GAC GAC AT GG C GGT G GT GGT T AAC GGGGT T C GCAAGAC CT A 
3266536 



Qy 3034 CAAGGAC GACAAGAAG CT G GC C C T GAAC AAG C T GAGC C T GAAC C T CT AC GAGAAC CAG GT 3093 

I I I I II I I I I I I I I I I I I I II III I I III 

Db 32 66537 CGGCAAGGGCAAGATTGTGGCCCTCGATGACGTGAGTTTCAAGGTGCGCCGCGGTGAAGT 
3266596 



Qy 3094 GGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGG 3153 

III I I I I I I I I I I I I I I I I I II II I I I I I I I II I I I I I I I 

Db 32 66597 GATCGGGCTGCTGGGCCCCAACGGGGCCGGCAAGACGACCATGGTGGACATCTTGTCGAC 
3266656 



Qy 3154 C CT GT T C C CT CCAAC GT C G GGT T C C G C C AC CAT CT AC GGGC ACGAC AT C C GCAC GGAGAT 3213 

I I I I I I I I I I I I I I I I I I I I I I I I I I III 

Db 32 66657 GCTGACCCGACCGGATGCCGGCTCGGCGATCATCGCTGGCTACGATGTTGTTTCCGAACC 
3266716 



Qy 3214 G GAT GAGAT C CG CAAGAAC CT GG GCAT GT GC C C GC AGC ACAAT GT G CT C TT T GAC C GGCT 3273 

III I I I I I I I I I I I I I I II I II I I I 

Db 32 66717 GGCCGGTGTACGCCGCTCGATCATGGTCACCGGGCAGCAGGTGGCCGTCGACGACGCGCT 
3266776 



Qy 3274 CACGGTGGAGGAACACCTCT GGT TCTACTCACGGCTCAAGAGCAT GGCT CAGGAGGAGAT 3333 

II I I I I I I I I I I I I I I I I II II II II 

Db 32 66777 TTCCGGTGAGCAGAACCTGGTGTTGTTTGGTCGTCTGTGGGGACTGAGCAAGTCCGCGGC 
3266836 



Qy 3334 C CGCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT C CAACAAACG GCAC T C ACT 3393 

I I I I I I I I I I I I I I I I I III I II I 

Db 3266837 GCGCAAACGCGCCGCCGAACTGCTCGAGCAATTCAGCCTCGTACATGCCGGAAAGAGGCG 
3266896 



Qy 3394 GGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGG 3453 

I I I I III I I I I I I I I I II I I I I I II I I I I I I 

Db 32 668 97 GGTGGGCACCTACTCCGGCGGAATGCGCCGACGAATAGACATCGCGTGCGGATTGGTGGT 
3266956 



Qy 3454 CGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCG 3513 

I I I I I I I I I I I I I I I I I I III I I I I I I III 

Db 3266957 CCAACCCCAGGTGGCGTTCTTAGACGAGCCCACCACCGGGCTCGATCCCAGGAGCCGGCA 
3267016 



Qy 3514 CGCCATCTGGGACCTCATCCTGAAGTAC AAGCCAGGCCGCACCATCCTTCTGTCCAC 357 0 

I I I I I II I I I I I I II I I I I III III I I I I I I I 
Db 32 67 017 AGCTATTTGGGATCTGGTGGCCAGCTTCAAGAAGCTGGGCATTGCCACGTTGTTGACCAC 
3267076 

Qy 3571 CCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAA 3630 

II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
Db 326707 7 G C AGT AT CT C GAGGAG G C GGAT G C G C T CAGT GAC C GCAT CAT C CT GAT C GAT CAC GGC AT 
3267136 

Qy 3631 GCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGC 3688 

III I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 3267137 AATCATCGCCGAAGGCACCGCGAATGAACTCAAGCACCGCGCCGGCGACACCTTCTGC 3267194 



RESULT 13 
US-09-103-840A-1 

; Sequence 1, Application US/09103840A 

; Patent No. 6294328 

; GENERAL INFORMATION: 

; APPLICANT: FLEISCHMAN, Robert D. 

; APPLICANT: WHITE, Owen R. 

; APPLICANT: FRASER, Claire M. 

; APPLICANT: VENTER, John C. 

; TITLE OF INVENTION: DNA SEQUENCES FOR STRAIN ANALYSIS IN MYCOBACTERIUM 

; TITLE OF INVENTION: TUBERCULOSIS 

; FILE REFERENCE: 24366-20007.00 

; CURRENT APPLICATION NUMBER: US/09/103, 840A 

; CURRENT FILING DATE: 199 8-0 6-24 

; NUMBER OF SEQ ID NOS : 2 

; SOFTWARE: Patentln Ver. 2.1 

; SEQ ID NO 1 

LENGTH: 4411529 

TYPE: DNA 

; ORGANISM: Mycobacterium tuberculosis 

OTHER INFORMATION: H37Rv 
US-09-103-840A-1 



Query Match 1.6%; Score 129.2; DB 3; Length 4411529; 

Best Local Similarity 49.7%; Pred. No. 9.8e-15; 

Matches 357; Conservative 0; Mismatches 358; Indels 3; Gaps 1; 

Qy 2974 GGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTA 3033 

I I I I I I I III I I I I I I I I I I MM III 

Db 3272201 GGAGGATCGGATGCGCAACGACGACATGGCGGTGGTGGTTAACGGGGTTCGCAAGACCTA 
3272260 



Qy 3034 CAAGGAC GACAAGAAG C T G GC C CT GAACAAGCT GAGC C T GAAC C T C T AC GAGAAC C AGGT 3093 

I I I I I I I I Mill! I | | | I I Ml | | IM 

Db 32722 61 CGGCAAGGGCAAGATTGTGGCCCTCGATGACGTGAGTTTCAAGGTGCGCCGCGGTGAAGT 
3272320 



Qy 3094 GGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGG 3153 

III I I I I I I I I I I II I I II I II I I I I I I I I I II II I I II I 

Db 3272321 GATCGGGCTGCTGGGCCCCAACGGGGCCGGCAAGACGACCATGGTGGACATCTTGTCGAC 
3272380 



Qy 3154 

Db 3272381 
3272440 

Qy 3214 GGATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCT 327 3 

III I I I I I I I I I I I I I I II I I I I I I 

Db 3272441 GGCCGGTGTACGCCGCTCGATCATGGTCACCGGGCAGCAGGTGGCCGTCGACGACGCGCT 
3272500 

Qy 3274 CACG GT G GAG GAAC AC C T C T G GT T CT AC T CACGGC T CAAGAG CAT GG CT CAG GAGGAGAT 3333 

II I I I I I I I I II I I II I I II II I I II 

Db 3272501 TTCCGGTGAGCAGAACCTGGTGTTGTTTGGTCGTCTGTGGGGACTGAGCAAGTCCGCGGC 
3272560 

Qy 3334 CC GCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT C CAACAAACGGCACTC ACT 3393 

I I I I I I I I I I I I I I I I I III I || | 

Db 3272561 GCGCAAACGCGCCGCCGAACTGCTCGAGCAATTCAGCCTCGTACATGCCGGAAAGAGGCG 
3272620 

Qy 3394 GGTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGG 3453 

I I I I Ml I I I I I I I I I II I I I I I II I I I I I I 

Db 3272621 GGTGGGCACCTACTCCGGCGGAATGCGCCGACGAATAGACATCGCGTGCGGATTGGTGGT 
3272680 

Qy 3454 CGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCG 3513 

I M I I I I I I I I I I I I I I I III I I I I I I Ml 

Db 3272681 CCAACCCCAGGTGGCGTTCTTAGACGAGCCCACCACCGGGCTCGATCCCAGGAGCCGGCA 
3272740 

Qy 3514 CG C CAT CT G GGACC T CAT C CT GAAGT AC AAGCCAGGCCGCACCATCCTTCTGTCCAC 3570 

I I I I I M I I I I I I II M I I III III I I I I I I I 
Db 3272741 AGCTATTTGGGATCTGGTGGCCAGCTTCAAGAAGCTGGGCATTGCCACGTTGTTGACCAC 
3272800 

Qy 3571 CCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAA 3630 

II I I I I I I I I I I I III I I I I I I I I I I I I I I I I I I I 
Db 3272801 GC AGT AT CT C GAGGAGG C GGAT GC GCT CAGT GAC C G CAT CAT C CT GAT C GAT C AC GGCAT 
3272860 

Qy 3631 GCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGC 3688 

Ml I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 3272861 AATCATCGCCGAAGGCACCGCGAATGAACTCAAGCACCGCGCCGGCGACACCTTCTGC 3272918 



CCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGAT 3213 

III II II I I I I I I I I I I I I II II I I I III 

GCTGACCCGACCGGATGCCGGCTCGGCGATCATCGCTGGCTACGATGTTGTTTCCGAACC 



RESULT 14 

US-09-252-991A-4633 

; Sequence 4633, Application US/09252991A 
; Patent No. 6551795 
; GENERAL INFORMATION: 

; APPLICANT: Marc J. Rubenfield et al . 

; TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

; TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
; FILE REFERENCE: 107196.136 

; CURRENT APPLICATION NUMBER: US/09/252, 991A 



; CURRENT FILING DATE: 1999-02-18 

; PRIOR APPLICATION NUMBER: US 60/074,788 

; PRIOR FILING DATE: 1998-02-18 

; PRIOR APPLICATION NUMBER: US 60/094,190 

; PRIOR FILING DATE: 1998-07-27 

; NUMBER OF SEQ ID NOS : 33142 

; SEQ ID NO 4633 

; LENGTH: 93 0 

TYPE : DNA 
; ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-4633 

Query Match 1.6%; Score 12 6.2; DB 4 ; Length 930; 

Best Local Similarity 51.1%; Pred. No. 4.6e-15; 

Matches 352; Conservative 0; Mismatches 32 8; Indels 9; Gaps 2; 



Qy 624 0 TGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCG 62 99 

I I I I II M I Mill I I II I I II III Ml M I I I I 

Db 50 TGGCGGTGGACGACCTGTCCTTCCAGGTGGCGACGGGGGAGGTACTGGGCTTCCTCGGTC 109 

Qy 6300 T CAACGGTGCGGGCAAGAC CAGCACCTT CAAGAT GCTGACCGGCGAC GAGAGCAC GACGG 6359 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | | || | 

Db 110 CGAACGGCGCCGGCAAGTCCACCACCATGAAGATGCTCACCGGCTTCCTGGCGCCCAGCG 169 

Qy 6360 GGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGA 6419 

IN M I I I M I III II I I I I I I I 

Db 17 0 CCGGCACCGCGAGCATCTTCGGCTTCGACATCCGCAACCGCACGCTGCAGGCGCAGCGGC 22 9 

Qy 642 0 GCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACC 6479 

I I I I I I I I I I I I I II I Ml || I M I III II 

Db 23 0 TGATCGGCTACCTCCCGGAAGGTTCGCCCTGCTACGCGGAAATGACCGTGCAGGGCTTCC 2 89 

Qy 64 8 0 TGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGT 6539 

III II I I I I I I I I I I I I I I I III 

Db 290 TCGATTTCATCGCCGAGATCCGTGGCTACCGTGGTGCCGGCAAGCGCGAGCGGGTCGCCC 34 9 

Qy 654 0 GGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCG 6599 

I I I I I I I I I I I I I I I I I I III Ml I III I I 

Db 350 GGGCACTGGGGCTGCTGGAACTGGACGAGGTGCGCCGGCAGACCATCGAAACCCTCTCCA 4 09 

Qy 6600 GCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCT 6659 

I I I I Ml I I I I I I I I I I I I III I 

Db 410 AGGGCTTCCGCCGGCGTGTCGGCCTGGCCCAGGCGATCCTCCACGAACCGCGGGCGCTGG 4 69 

Qy 6660 TCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCA 6719 

I I I I I I I I I I I I I I I M II Ill III I I I I 

Db 47 0 T G CT C GAC GAGCC CAC C GAC GG G CT C GAT C C GAAC CAGAAG CAC C AGGT CC GC GAACT GA 52 9 

Qy 6720 T C C T C GACCT CAT CAAGACAGGGC GT T C AGT G GT GCT GACAT CAC AC AG CAT G GAG GAGT 6779 

I I I I I I I M II I III I I I I I I I I I I I I I I I I I 

Db 530 TCCGCGGCCTCGCGCAG GAG C G CAT C GT GAT CAT C T C CAC C CAT AT C C T C GAG GAAG 58 6 

Qy 6780 GCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCA 6839 

I I I I I I I I I I I I II I I I I I I I I I I I || | | | | | | | | 

Db 587 TCTCGGCGCTGTGCAGCCG CGCCCTGGTGATCGGCGGCGGGCGGCTGCTGGCGG 640 

Qy 684 0 G CAT C CAG CAC CT GAAG AAC C GGT T T G GAGAT GGC T AC AT GAT CAC G GT G C G GAC C AAG A 68 99 



Db 641 ACAGCACGCCGCTGGAGCTGGCCAGCCGCTCGCGCTACCACCAGGCGGTGACGCTCTACA 700 

Qy 69 00 G C AG C C AGAGT G T GAAG G AC GTGGTGCGG 6928 

II III I I I I I I I I I I I I 

Db 701 GCGACGAGCCCCTGGATGCCGTGGCGCTG 729 



RESULT 15 

US-09-252-991A-4241/c 

Sequence 4241, Application US/09252991A 
Patent No. 6551795 
GENERAL INFORMATION: 
APPLICANT: Marc J. Rubenfield et al . 

TITLE OF INVENTION: NUCLEIC ACID AND AMINO ACID SEQUENCES RELATING TO 
PSEUDOMONAS 

TITLE OF INVENTION: AERUGINOSA FOR DIAGNOSTICS AND THERAPEUTICS 
FILE REFERENCE: 107196.136 

CURRENT APPLICATION NUMBER: US/ 0 9/252 , 9 91A 
CURRENT FILING DATE: 1999-02-18 
PRIOR APPLICATION NUMBER: US 60/074,788 
PRIOR FILING DATE: 1998-02-18 
PRIOR APPLICATION NUMBER: US 60/094,190 
PRIOR FILING DATE: 1998-07-27 
NUMBER OF SEQ ID NOS : 33142 
SEQ ID NO 4241 
LENGTH: 117 9 
TYPE: DNA 

ORGANISM: Pseudomonas aeruginosa 
US-09-252-991A-4241 

Query Match 1.6%; Score 126.2; DB 4; Length 1179; 

Best Local Similarity 51.1%; Pred. No. 4.9e-15; 

Matches 352; Conservative 0; Mismatches 328; Indels 9; Gaps 2; 

Qy 62 4 0 TGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCG 6299 

I I I I I I I I I I I I I I 1 I III I I I I I I III I I I I I I 

Db 899 TGGCGGTGGACGACCTGTCCTTCCAGGTGGCGACGGGGGAGGTACTGGGCTTCCTCGGTC 84 0 

Qy 6300 T C AAC GGTGCGGG C AAG AC C AG C AC C T T C AAG AT G C T G AC C G G C G AC GAG AG C AC G AC G G 6359 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 

Db 839 CGAACGGCGCCGGCAAGTCCACCACCATGAAGATGCTCACCGGCTTCCTGGCGCCCAGCG 780 

Qy 6360 GGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGA 6419 

III II III II I III II I II I I II I I I I I I 

Db 77 9 CCGGCACCGCGAGCATCTTCGGCTTCGACATCCGCAACCGCACGCTGCAGGCGCAGCGGC 72 0 

Qy 6420 GCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACC 6479 

I I I I I I I I I I I I I II I III II I I I I III II 

Db 719 TGATCGGCTACCTCCCGGAAGGTTCGCCCTGCTACGCGGAAATGACCGTGCAGGGCTTCC 660 

Qy 64 8 0 TGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGT 6539 

III II I I I I I II I I I I I I I I I II 

Db 659 TCGATTTCATCGCCGAGATCCGTGGCTACCGTGGTGCCGGCAAGCGCGAGCGGGTCGCCC 600 

Qy 654 0 GGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCG 6599 

I I I I I I I I I I I I I I I I I I I II II I I III I I 



Db 5 99 GGGCACTGGGGCTGCTGGAACTGGACGAGGTGCGCCGGCAGACCATCGAAACCCTCTCCA 54 0 

Qy 6600 GCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCT 6659 

I I I I I II I I I I I I I I I I I I IN I 

Db 539 AGGGCTTCCGCCGGCGTGTCGGCCTGGCCCAGGCGATCCTCCACGAACCGCGGGCGCTGG 480 

Qy 6660 TCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCA 6719 

I I I I I I I I I I I I I I I II I II I I I I II I Ml I | I I 

Db 479 TGCTCGACGAGCCCACCGACGGGCTCGATCCGAACCAGAAGCACCAGGTCCGCGAACTGA 420 

Qy 6720 T C CTCGACCT CAT CAAGACAGGGCGT T CAGT GGT GCTGACAT CACACAGCATGGAGGAGT 6779 

I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 

Db 419 TCCGCGGCCTCGCGCAG GAGCGCAT CGT GAT CATCT C CACCCATAT C CT C GAGGAAG 363 

Qy 6780 GCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCA 6839 

I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I 

Db 362 TCTCGGCGCTGTGCAGCCG CGCCCTGGTGATCGGCGGCGGGCGGCTGCTGGCGG 309 

Qy 6840 GCAT C CAGCACCT GAAGAACCGGTT T GGAGAT GGCT ACAT GATCAC GGT GCGGACCAAGA 6899 

I I I I I I I I I I I I I I I I lllll I III 

Db 308 ACAGCACGCCGCTGGAGCTGGCCAGCCGCTCGCGCTACCACCAGGCGGTGACGCTCTACA 24 9 

Qy 6900 G C AGC CAGAGT GT GAAG GAC GT G GT GC G G 6928 

II III II I I I I I I I I I I 

Db 248 GCGACGAGCCCCTGGATGCCGTGGCGCTG 220 

Search completed: September 8, 2004, 18:24:02 
Job time : 598 sees 



GenCore version 5.1.6 
Copyright (c) 1993 - 2004 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 



Run on : 



Title: 

Perfect score: 
Sequence : 

Scoring table: 



September 8, 2004, 13:23:39 ; Search time 3572 Seconds 

(without alignments) 
11188.113 Million cell updates/sec 

US-10-088-467-1 
8040 

1 ccgcggcgctgaggcggcgg aaataaataaacaaaatgtc 8040 

I DENT I T Y_NUC 

Gapop 10.0 , Gapext 1.0 



Searched: 



3267054 seqs, 2485319735 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



6534108 



Post-processing : 



Minimum Match 0% 
Maximum Match 100% 
Listing first 45 summaries 



Database 



Published_Applications_NA: * 

/cgn2_6/ptodata/l/pubpna/US07_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/PCT_NEW_PUB. seq:* 
/ cgn2_6/ptodata/ l/pubpna/US0 6_NEW_PUB . seq : * 
/cgn2_6/ptodata/l/pubpna/US06_PUBCOMB. seq:* 
/cgn2_6/ptodata/l/pubpna/US07_NEW_PUB. seq: * 
/cgn2_6/ptodata/l/pubpna/PCTUS_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/US08_NEW_PUB. seq: * 
/cgn2_6/ptodata/l/pubpna/US08_PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/US09A__PUBCOMB. seq: * 
/cgn2_6/ptodata/l/pubpna/US09B_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/US09C_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq: * 
/cgn2_6/ptodata/l/pubpna/US09_NEW_PUB. seq2 : 
/cgn2_6/ptodata/l/pubpna/USlOA_PUBCOMB.seq: 
/cgn2_6/ptodata/l/pubpna/US10B_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/US10C_PUBCOMB. seq: 
/cgn2_6/ptodata/l/pubpna/USlO_NEW_PUB. seq: * 
/cgn2_6/ptodata/l/pubpna/US60_NEW_PUB. seq: + 
/cgn2_6/ptodata/l/pubpna/US60_PUBCOMB. seq: * 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
US-10-072-621-3 

; Sequence 3, Application US/10072621 
; Publication No. US20020169137A1 
; GENERAL INFORMATION: 



; APPLICANT: Reiner, Peter B. 
; APPLICANT: Connop, Bruce P. 
; APPLICANT: Pollard, Michelle 

; TITLE OF INVENTION: REGULATION OF AMYLOID PRECURSOR PROTEIN EXPRESSION 
; TITLE OF INVENTION: BY MODIFICATION OF ABC TRANSPORTER EXPRESSION OR 
ACTIVITY 

; FILE REFERENCE: 100103.402 

; CURRENT APPLICATION NUMBER: US/10/072, 621 
; CURRENT FILING DATE: 2002-02-08 
; NUMBER OF SEQ ID NOS : 10 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 3 

LENGTH: 8056 

TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-072-621-3 



Query Match 


100.0%; Score 8040; DB 14; Length 8056; 




Best 


Local 


Similarity 100.0%; Pred. No. 0; 




Matches 8040; Conservative 0; Mismatches 0; Indels 0; Gaps 


o 


Qy 


1 


CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 


60 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


17 


CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 


76 


Qy 


61 


GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 


120 






M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


77 


GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 


136 


Qy 


121 


CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 


180 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 




Db 


137 


CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 


196 


Qy 


181 


CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 


240 






1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 I 1 I M 1 1 1 1 1 II 1 II 1 1 1 1 1 II 1 1 1 1 1 1 




Db 


197 


CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 


256 


Qy 


241 


TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 


300 






1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I || I I I I I I I I | I I I I I | 




Db 


257 


TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 


316 


Qy 


301 


CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 


360 






1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 I I 1 1 I I I I I I | M 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


317 


CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 


376 


Qy 


361 


GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 


420 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


377 


GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 


436 


Qy 


421 


GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 


480 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 




Db 


437 


GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 


496 


Qy 


481 


CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 


540 






1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 I I I | I I I I 1 1 1 1 I | 




Db 


497 


CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 


556 



Qy 


C A 1 

541 


CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 II M 1 M 1 1 1 

CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 616 


UD 


DO 1 


Qy 


oUl 


GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 
1 M II II 1 1 1 1 1 1 II 1 II II 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 I I I I || | M 1 1 1 1 1 1 1 II 1 1 
GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 67 6 


UD 


61 / 


Qy 


661 


GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 
1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 I 1 I I | | | | | | | | | | | | | 
GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 736 


DO 


oil 


Qy 


721 


GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 78 0 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | | | | | | 1 1 1 1 1 1 1 
GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 79 6 


Db 


737 


Qy 


781 


GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I M I | | | | M 1 1 1 1 1 
GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 85 6 


Db 


797 


Qy 


841 


CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 
M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 916 


Db 


857 


Qy 

Db 


901 
917 


CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 976 


Qy 


961 


CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 
1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 I I I I I I I I I | | | | 
CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1036 


Db 


977 


Qy 


1021 


TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

M 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 I I I 1 1 1 1 1 1 II ! 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1! 1 1 1 1 1 

TGCCCAG7\AGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1096 


Db 


1037 


Qy 


1081 


GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 
N 1 1 1 1 1 1 1 1 1 1 1 i 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 I I I I I I I I | | | | | | | | | | | | | | | | | | | | 
GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1156 


Db 


1097 


Qy 


1141 


TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

1 1 1 1 1 1 M 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1216 


Db 


1157 


Qy 


1201 


TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1276 


Db 


1217 


Qy 


1261 


CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 MINI 

CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1336 


Db 


1277 


Qy 


1321 


GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 

GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1396 


Db 


1337 


Qy 


1381 


CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 



Db 1397 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1456 

Qy 1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I I I I I I I M I M M I I I I I I I I I I I I I I I I I I I I I | | | | | | | M I I I I I I I I I I I 
Db 1457 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1516 

Qy 1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1517 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1576 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I M I I I I I I I I I I 

Db 1577 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1636 

Qy 1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

M I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1637 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 169 6 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I | | I | 
Db 1697 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1756 

Qy 17 41 C CAGTT CAT GT C CAAGGT GAG C GT G G AC AT C TT CAAGGG CT T C C C C GAC GAG GAGAGC AT 1800 

I I I I I M I II I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I II I I I I 

Db 1757 C CAGTT CAT GT C CAAGGT GAGC GT G GAC AT CT T CAAGGGCT T C CC CGAC GAGGAGAGC AT 1816 

Qy 18 01 T GT CAACTACACCCT CAACCAGGCCTAC CAGGACAAC GT CACT GT TTTT GCCAGT GT GAT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I || I I 
Db 1817 T GT CAACT AC AC CCT CAAC C AG GC C T AC C AG GAC AAC GT CACT GT TT TT GC C AGT GT GAT 1876 

Qy 18 61 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

I I I I M I I M I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I M I I 

Db 1877 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1936 

Qy 1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 198 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I | | | I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1937 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1996 

Qy 1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 204 0 

I I I I I I I I II I I I I I II I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1997 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 056 

Qy 2041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I II I || | | | | | | | | 
Db 2057 C G C CAT CAT C GAC AC TTTTGTGGGG C AC GAC GT GGT GG AG C C AG G C AG C T AC GT GCAG AT 2116 

Qy 2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2117 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2176 

Qy 2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2177 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2236 

Qy 2221 GGAGAAGGAGCACC GGCT CAAGGAGGT GAT GAAGACCAT GGGC CT GAACAACGCGGT GCA 2280 

I I I I I I I I I I I | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 



Db 


2237 


Qy 


2281 


Db 


2297 


Qy 


2341 


Db 


2357 


Qy 


2401 


Db 


2417 


Qy 


2461 


Db 


2477 


Qy 


2521 


Db 


2537 


Qy 


2581 


Db 


2597 


Qy 


2641 


Db 


2657 


Qy 


2701 


Db 


2717 


Qy 


2761 


Db 


2777 


Qy 


2821 


Db 


2837 


Qy 


2881 


Db 


2897 


Qy 


2941 


Db 


2957 


Qy 


3001 


Db 


3017 


Qy 


3061 


Db 


3077 



G GAGAAG GAG CAC C G GCT CAAG GAGGT GAT GAAGAC CAT G GGC C T GAACAAC G C G GT G C A 22 96 

CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 234 0 
I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I | | I | | I | | | | | | | | | | | | | | | | | 
CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2356 

CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 
I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I 
CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2416 

CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2476 

CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 
I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I | | | | 
CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2536 

CAT GTACGT GGCGAT CC GAGAGGAGGT GGC GCAT GATAAGAT CACGGC CTT CGAGAAGT G 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAT GT AC GT GG C GAT C C GAGAGGAG GT GGC GCAT GATAAGAT CAC GGC C T T C GAGAAGT G 2596 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 640 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | M I I I I I I I I 

CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2656 

TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2716 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 277 6 

CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 283 6 

CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 880 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 289 6 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I MINIUM 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2956 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I M I M I II I I I I I I I I II I I II I II I M I II I I I M I I II I I I II I I II M I M M II I 

G GAGAG CCGGCGCTTT GAGGAGAC C C GT GG CAT G GAGGAGGAG C C CAC C CAC CTGCCTCT 3016 
GGTTGTCTGCGTG G AC AAAC T CAC CAAG G T C T AC AAG G AC G AC AAG AAG CTGGCCCT G AA 3060 

I I I I I I I I M M M I I I I I II I I I I I I I M I I I II I I I I I I I I II I I I I I I I I II 

GGTTGTCTGCGTG GACAAAC T CAC CAAG GT CT ACAAGGAC GAC AAGAAG CT GG C C CT GAA 3076 
CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 312 0 

I I I I I I I I M II I I I I I I I I I II I II I II M I I I I I I I I I II I I II I I II II II I I I II I 

CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3136 



Qy 3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3137 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3196 

Qy 3181 C AC CAT C T AC G G G C AC G AC AT C C G C AC G G AGAT G GAT GAGAT C C G C AAG AAC C T GG GC AT 324 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I 
Db 3197 C AC CAT C T AC G G G C AC G AC AT C C G C AC G GAGAT G GAT GAGAT C C G C AAG AAC C T G G G CAT 3256 

Qy 3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I || I I 
Db 3257 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3316 

Qy 3301 CT CACGG C T CAAGAG C AT GGC T C AGGAG GAGAT C C G CAGAGAGAT G GAC AAGAT GAT C GA 3360 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 3317 CT CACGGCT CAAGAGCAT GGCT CAGGAGGAGAT C CGCAGAGAGAT GGACAAGAT GAT C GA 3376 

Qy 3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3377 G GAC CT G GAG CT CT C CAACAAAC GGC AC T C AC T G GT G CAGAC AT T GT C GG GT GG C AT GAA 3436 

Qy 3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 

Db 3437 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3496 

Qy 34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I M I I I I I I I I I I I M I I I 

Db 34 97 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3556 

Qy 3541 CAAG CC AGG C C GC AC CAT C CT T CT GT C C AC C CAC C AC AT GGAT GAGGCT GAC CT GCT T G G 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M 
Db 3557 CAAGCCAGGCCGCAC CAT CCTTCTGTCCACCCACCACAT GGAT GAGGCT GACCTGCTTGG 3616 

Qy 3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3617 GGACCGCATTGCCAT CAT CTCC CAT GGGAAGCTCAAGT GCT GC GGCT CCCCGCTCTTCCT 3676 

Qy 3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3677 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3736 

Qy 3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I I I I I II I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3737 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3796 

Qy 3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I I M I I I II I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3797 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3856 

Qy 3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I 

Db 3857 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3916 

Qy 3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I M I I I I I I I I I I I I I I II I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 3917 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3976 



Qy 3961 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3977 G C T GAT G G AC AC GAC C C T G GAG GAAG T GT T C C T C AAG GT GT C G GAG GAG GAT C AGT C G CT 4036 

Qy 4021 GGAGAACAGT GAGGC C GAT GT GAAG GAGTCCAGGAAG GAT GT GCTC CCTGGGGCGGAGGG 4 080 

I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I II I I I II I II I I I I I || I I I I I I 
Db 4037 GGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4096 

Qy 4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I 
Db 4 097 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4156 

Qy 4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 4157 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4216 

Qy 4201 C T AC AC C GAC GT C TAT GGC GACT AC CGCCCCCTCTTT G AT AAC C C AC AGGAC C C AGAC AA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4217 C T AC AC C GAC GT CT AT GGC GAC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AGAC AA 4276 

Qy 4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I II I I II I I I I I I I I I I II 
Db 4277 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4336 

Qy 4 321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 337 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4396 

Qy 4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4397 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4456 

Qy 4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 4457 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4516 

Qy 4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 517 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4576 

Qy 4 561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 62 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4577 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4636 

Qy 4 621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4637 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4696 

Qy 4 681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 4697 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4756 

Qy 4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4757 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4816 

Qy 4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4860 



Db 4 817 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 87 6 

Qy 4 8 61 GCAGGCCTGG7^ACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II 1 I I II 
Db 4877 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4936 

Qy 4 921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 498 0 

I I I I I I I I I M I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I II II I I I I I I 

Db 4937 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4996 

Qy 4 981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 997 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5056 

Qy 5041 CAT C CT GAC C GAC AT CAC C G G C C AC AAT GT CT CT GAGT AC CT GCT C T T C AC CT C C GAC C G 5100 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5057 CAT C CT GAC C GACAT CAC C GG C C ACAAT GT CT CT GAGTACC T G CT CT T C AC CT C CGAC C G 5116 

Qy 5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5117 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 517 6 

Qy 5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5177 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5236 

Qy 5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5237 GGTTTT CT ACAACAACAAGGGCT AT CAC AGC AT GC CCAC CT AC CT CAACAGC CT CAACAA 5296 

Qy 5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I II 

Db 52 97 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5356 

Qy 5341 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5400 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I 
Db 5357 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5416 

Qy 54 01 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 54 60 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I 
Db 5417 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5476 

Qy 5461 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 552 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 5477 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5536 

Qy 5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5537 C G GCT GCAAC C C CAT CAT CT AC T G GC T G GC GAAC T AC GT GT GG GAC AT GCT CAACTAC C T 5596 

Qy 5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 5597 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5656 

Qy 5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 5657 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5716 

Qy 5701 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5717 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 577 6 

Qy 57 61 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 582 0 

I I I I I I I I I I I I I I II I I I I I I I I I ! I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 5777 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5836 

Qy 5821 CGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTT 58 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | | I I 
Db 5837 C GAG C AC GACAAGGAC C T GAAG GT T GT CAACAGT T AC C T GAAAAG CT G CT T C CT C AT TT T 5896 

Qy 58 81 C C C C AAC T ACAAC CT GG GC C AC G G GC T CAT G GAGAT GGCCTACAAC GAGT AC AT CAACGA 594 0 

I I I II II I I I I I I I 1 I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 58 97 CCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGA 5956 

Qy 5 941 GT AC T AC G C C AAGAT T G G C C AGT T T G AC AAGAT GAAGT CCCCGTTC GAGT G G G AC AT T G T 6000 

I I I I I I I I I I I I I I I I I I II I I I I I I I I 1 I I I I I I I II I I I I I M I || | | | | | 

Db 5957 GT ACT AC GC CAAGAT T G G C C AGT T T GACAAGAT GAAGT C C C C GT T C GAGT GGGAC AT T GT 6016 

Qy 6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I 
Db 6017 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6076 

Qy 6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M | | | | 
Db 6077 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6136 

Qy 6121 GGAT GAT GT GGAC GT GG CCAGT GAGC G GCAGC GAGT G C T C C G G GGAGAC GC C GACAAT GA 6180 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I 
Db 6137 G GAT GAT GT GG AC GT GG C C AGT GAG C GG CAG C GAGT GCT C C G GG GAGAC G C C GACAAT GA 6196 

Qy 6181 CAT GGT CAAGAT T G AGAAC CT GAC CAAGGT CT ACAAGT C C C GGAAGATT GGCC GT AT C C T 6240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I | | | | | | | | | | | | | 
Db 6197 CAT G GT CAAGAT T GAGAAC C T GAC CAAG GT CT ACAAGT C C C GGAAGATT G G CC GT AT C CT 6256 

Qy 62 41 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 
Db 6257 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6316 

Qy 6301 C AAC GGTGCGGG C AAGAC C AGC AC CT T CAAGAT GCT GAC C G GC GAC GAG AGC AC GAC G G G 6360 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 6317 C AAC GGT GC GGG C AAGAC C AGC AC CT T CAAGAT GCT GAC C GGC GAC GAGAG C AC GAC GG G 6376 

Qy 6361 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6420 

I I I I I I I I I I I I I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I | I I | M | | || | | | 
Db 6377 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6436 

Qy 6421 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 6437 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6496 

Qy 64 81 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I 
Db 6497 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6556 



Qy 6541 G G CT C T GGAGAAG C T G GAGCT GAC CAAGT AC G C AGACAAG CCGGCTGG C AC C T AC AGC G G 6600 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 

Db 6557 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6616 

Qy 6601 CGGC7^CAAGCGG7\AGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

II I I I I I I I I I I I I II II I I I I I I M I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6617 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 667 6 

Qy 6661 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6720 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6677 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6736 

Qy 6721 CCT C GAC CT CAT CAAGACAGGGCGTT CAGT GGT GCT GACAT CACACAGCATGGAGGAGT G 67 8 0 

I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6737 C C T C GAC CT CAT CAAGACAGG G C GT T CAGT GGT GCT GACAT CACAC AGC AT G GAG GAGT G 6796 

Qy 67 81 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6797 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6856 

Qy 6841 CAT C CAGCAC CT GAAGAAC C GGT T T G GAGAT GG CT AC AT GAT C AC GGT G C GGAC C AAGAG 6900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6857 CAT C CAG C AC CT GAAGAAC CGGT T T G GAGAT GGC TACAT GAT C AC G GT G C GGAC CAAGAG 6916 

Qy 6901 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 6960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6917 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 697 6 

Qy 69 61 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I 
Db 6977 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7 036 

Qy 7 021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 708 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 7037 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7096 

Qy 7 081 CAG C CAGAC CACAC T G GACAAT GT GT T C GT GAAC T T T G C CAAGAAGC AGAGT GACAAC CT 714 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 7097 CAG C CAGAC CACACT G GACAAT GT GT T C GT GAACT T T GCCAAGAAGCAGAGT GACAAC CT 7156 

Qy 7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7157 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7216 

Qy 72 01 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 7217 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7276 

Qy 72 61 GGAC C T GGAC AC GGAG GAC GAG G G C CT C AT C AG CT T C GAGGAGGAG C GGGCC C AGCT GT C 7320 

I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7277 GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 7336 

Qy 7321 CT T C AAC AC GGACAC GCT CT GC T GAC CAC C C AGAG C T G G G C CAGGGAG GAC AC GC T C C AC 738 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7337 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7396 



Qy 
Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



7381 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 744 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 
73 97 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7456 

7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I 
7457 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7516 

7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I 
7517 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7576 

7561 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 762 0 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7577 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7636 

7621 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7637 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7696 

7681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 774 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7697 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7756 

7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7757 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7816 

7 8 01 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 78 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
7817 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7876 

7 8 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7920 

I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I 
7 877 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7936 

7921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7980 

I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I 

7937 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7996 

7981 T G G GAG CCGGGCCT GT AC AT AG C G C AC AG AT GTTTGTTT T AAAT AAAT AAAC AAAAT GT C 8040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7997 T GGGAGC CG GG C CT GT ACAT AGC G CAC AGAT GTT T GT T T T AAAT AAAT AAAC AAAAT GT C 8056 
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Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 98 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 157 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 158 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 217 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAG7\AGCCCACCAT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I 
Db 218 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 277 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 8 CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 337 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 338 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 397 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 398 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 457 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 458 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 517 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 4 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 518 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 577 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 
Db 57 8 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 637 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 638 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 697 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 



698 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 757 

661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
7 58 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 817 

721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
818 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 877 

781 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 

I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

87 8 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 937 

841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I 

938 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 997 

901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
9 98 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1057 

9 61 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1058 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1117 

1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I 
1118 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1177 

10 81 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
117 8 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1237 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
1238 TGGCACTGGGGCAGGGGCAGTCATGGGCCCC7\ACGCCACCGCTGAGGAGGGCGCACCCTC 1297 

12 01 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I II 

1298 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1357 

1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I I I I II I I I I I I I I I I I! I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II 
1358 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1417 

1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1418 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1477 

1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
147 8 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1537 

14 41 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 
I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
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1538 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1597 

1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I II I 
1598 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1657 

15 61 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
1658 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1717 

1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
1718 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1777 

1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
177 8 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1837 

1741 C C AGT T CAT GT C C AAG G T GAG C G T G G AC AT C T T C AAG GGCTTCCCC G AC GAG GAG AG CAT 18 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I 
1838 C C AGT T CAT GT C CAAGGT GAG C GT GGAC AT CT T CAAG GGC T T C C C CGAC GAGGAGAGCAT 1897 

18 01 TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 1860 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
18 9 8 T GT CAACT ACAC C CT CAAC CAG G C CT AC CAG GACAAC GT C ACT GT TT T T G C C AGT GT GAT 1957 

1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I Ill 

1958 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 2 017 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2018 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2 077 

1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2078 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2137 

2041 C GC CAT CAT C GACACT TT T GT G GG GC AC GAC GT G GT G GAGC CAG G C AGCT AC GT GCAGAT 2100 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I 
2138 C GC CAT CAT C GACAC T TT T GT G GGGCAC GAC GT G GT GGAGC CAG G CAG CT AC GT G C AGAT 2197 

2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
2198 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2257 

2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2258 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2317 

2221 G GAGAAG GAGC AC C GG CT C AAGGAGGT GAT GAAGAC CAT GG GC C T GAACAAC G C G GT GCA 22 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
2318 G GAGAAG GAG C AC C GG CT C AAGGAGGT GAT GAAGAC CAT GG GC C T GAACAAC G CGGT G CA 2377 

22 81 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
237 8 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2437 



Qy 2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 24 00 

II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I II 
Db 2438 CGCCATCCTGAAGTACGGCCAGGTGCTTATACACAGCCACGTGGTCATCATCTGGCTCTT 2497 

Qy 2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I 
Db 2498 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2557 

Qy 24 61 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 252 0 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2558 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2 617 

Qy 2521 CAT GT AC GT GGC GAT CC GAG AG GAG GT GGC G CAT GAT AAGAT CAC GGC CTT CGAGAAGT G 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2618 CAT GT AC GT GG C GAT C C GAGAG GAG GT G GC GCAT GAT AAGAT CAC GG C CTT CGAGAAGT G 2677 

Qy 2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 64 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II 
Db 267 8 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 737 

Qy 2 641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 27 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2738 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2797 

Qy 2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 

I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I II I I I I I I I I I I I I I 
Db 279 8 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2857 

Qy 27 61 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 282 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2858 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 917 

Qy 2 821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 88 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 2918 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2977 

Qy 2881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 94 0 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 297 8 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3037 

Qy 2941 G GAGAGC C G GC GCT T T GAG GAGAC CC GT GG C AT GGAGGAGGAGCCCAC C CACC T GC CT CT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3038 G GAGAGC C G GC GC T T T GAG GAGAC C C GT GG CAT GGAGGAGGAGC C CAC C C ACC T G CCT CT 3097 

Qy 3001 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 3098 GGT T GT CT GC GT GGACAAACT CAC CAAG GT CT ACAAGGAC GACAAGAAGCT GG CC CT GAA 3157 

Qy 3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3158 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3217 

Qy 3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3218 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3277 



Qy 3181 CAC CAT C T AC G G GC AC GAC AT C C GC AC GGAGAT GGAT GAGAT C C G CAAGAAC CT GGG CAT 3240 

I I I M I I I I I I 1 I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3278 CAC CAT CT AC GG GC AC GAC AT CC G C ACGGAGAT GGAT GAGAT C C G CAAGAAC CT GGG CAT 3337 

Qy 3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I I > I I I M I I I I I I I I I I I M I I I I I I I I I I I I M I I M M I I 
Db 3338 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3397 

Qy 3301 CT CACGGCT C AAGAGCAT GGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT GAT CGA 3360 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3398 CT CACGGCT CAAGAGCAT GGCTCAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT GAT CGA 3457 

Qy 3361 G GAC CT G GAG CT CT C CAAC AAAC G GC ACT CAC T GGT G C AGAC AT TGTCGGGTGG CAT GAA 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I 
Db 34 58 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3517 

Qy 3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
Db 3518 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3577 

Qy 34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3578 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3637 

Qy 3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3638 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3697 

Qy 3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3698 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3757 

Qy 3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3758 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3817 

Qy 3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 378 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 3818 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3877 

Qy 37 81 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3878 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3937 

Qy 3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I M 

Db 3938 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3997 

Qy 3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I 
Db 3998 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4057 

Qy 3961 GCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCT 4 020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 4 05 8 G CT GAT G GACAC GACC C T GGAGGAAGT GT T C CT C AAG GT GT C G GAGGAG GAT C AGT C GCT 4117 



Qy 



4 021 G GAGAACAGT GAGG C C GAT GT GAAGGAGT C CAG GAAG GAT GTGCTCCCT GGG GC GGAGGG 4 08 0 



I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 4118 G GAGAAGAGT GAG GC C GAT GT GAAG GAGT C C AGGAAG GAT GTGCTCCCTGGGGCG GAGGG 4177 

Qy 4 081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 417 8 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4237 

Qy 4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 00 

I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 4238 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4297 

Qy 42 01 C T AC AC C G AC GT C TAT G G C G AC T AC CGCCCCCTCTTT G AT AAC C C AC AG G AC C C AG AC AA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 42 98 C T AC AC C G AC G T C TAT G G C G AC T AC CGCCCCCTCTTT GAT AAC C C AC AG G AC C C AG AC AA 4357 

Qy 42 61 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I II I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4358 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4417 

Qy 4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4418 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4477 

Qy 4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 447 8 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4537 

Qy 4 441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4538 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4597 

Qy 4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 4598 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4657 

Qy 45 61 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 62 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I 
Db 4 65 8 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4717 

Qy 4 621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4718 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 47 7 7 

Qy 4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4740 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4778 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4837 

Qy 4 741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4800 

I I I II I II I I II I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I 
Db 4 83 8 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4897 

Qy 4 8 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 4 898 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 957 

Qy 4 8 61 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 92 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



4 958 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 5017 

4 921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I II 

5 018 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 5077 

4 981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5040 

I I I I I I I I I I I I I I II I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5078 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5137 

5041 CAT C C T GAC C GAC AT C AC C G G C C AC AAT GT C T CT GAGT AC CTGCTCTT C AC CT C C GAC C G 5100 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I 
CAT C CT GAC C GACAT C AC C G G C C AC AAT GT CT CT GAGT AC CTGCTCTT CAC CT CC GAC C G 



5138 



5197 



5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I II I I I 
CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 



5198 



5161 



5257 



CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I M I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

5258 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5317 

5221 G GT T T T C T AC AAC AAC AAG G G C T AT CAC AG CAT G C C CAC C T AC C T C AAC AG C C T C AAC AA 52 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
GGT T T T C T AC AACAACAAG G G C TAT CAC AG C AT GC C CAC CT AC CT CAACAG C CT CAACAA 



5318 



5377 



52 81 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5340 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I 
537 8 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5437 

5341 C GT CAC CAAC C AC CC C AT GAAT AAGAC C AG CG C C AGC CTCTCCCTG GAT T AC CT GCT GC A 5400 

I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5438 C GT CAC CAAC C AC CC CAT GAAT AAGAC CAGCGC C AGC CTCTCCCTG GAT TACC T GCT GCA 5497 

5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I 

5498 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5557 

54 61 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCC7^GCATCTGCAGTTTGTCAG 552 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
5558 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5617 

5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 



5618 



5677 



5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

567 8 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5737 

5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5738 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5797 

57 01 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

57 98 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5857 



Qy 5761 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I 
Db 5858 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5917 

Qy 5821 C GAG C AC GAC AAG GAC CT GAAGGT T GT C AAC AGT T AC C T GAAAAGC TGCTTCCT CAT T T T 588 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I | | I | | I I I 
Db 5918 C GAGC AC GACAAGGAC CT GAAGGT T GT CAAC AGT TAC CT GAAAAGCT G C T T C C T CAT T T T 5977 

Qy 5881 C C C CAACT ACAAC CT GGGC CACGGG C T CAT GGAGAT G GC CT ACAAC GAGTAC AT CAAC GA 5940 

I II I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I II I I I II I I I 
Db 5 978 C C C CAAC T ACAAC CT GGGC CAC G G G C T CAT G GAGAT G GC CT ACAAC GAGT ACAT CAAC GA 6037 

Qy 5941 GT AC TAC G C C AAG AT T G G C C AGT T T GAC AAG AT GAAG TCCCCGTTC GAGT G G GAC AT T GT 6000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I II I I M I I I 

Db 603 8 GT ACT AC GC CAAGAT T GGC CAGT T T GACAAG AT GAAGT C C C C GT T C GAGT GGGAC AT T GT 6097 

Qy 6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | M I I I 
Db 6098 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6157 

Qy 6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 612 0 

I I I I I I II I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6158 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6217 

Qy 6121 G GAT GAT GT G GACGT GGCCAGT GAGC GG CAGC GAGT GCT C C GGGGAGAC GC CGACAAT GA 6180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6218 G GAT GAT GT GGAC GT G GC C AGT GAG C G GC AG C GAGT G CT C C G GG GAGAC GC CGACAAT GA 6277 

Qy 6181 CAT GGT CAAGAT T GAGAAC CT GAC CAAG GT CT AC AAGT C C C GGAAGAT T GGC C GT AT C CT 6240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 62 7 8 CAT GGT CAAGAT T GAGAAC CT GAC CAAG GT CT ACAAGT C C C G GAAGAT T G G C C GT AT C CT 6337 

Qy 6241 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I 
Db 6338 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6397 

Qy 6301 CAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGG 6360 

I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 
Db 6398 CAAC G GT G C G GGCAAGACC AGCAC CT T CAAGAT GC T GAC C GGCGAC GAGAG CAC GAC GGG 6457 

Qy 6361 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 64 58 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6517 

Qy 6421 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 64 8 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 6518 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6577 

Qy 64 81 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 654 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 6578 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6637 

Qy 6541 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 6638 GGCTCTGGAGAAGCTGGAGCT GAC CAAG TAC GCAGACAAGCCGGCTGGCACCTACAGCGG 6697 



Qy 6601 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

I M I I I I I I I I I i I I I I I I | | | | | M I I I I I I I I I I I I I It ! I I I I I I I I M I I I I I I I I 
Db 6698 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6757 

Qy 6661 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6720 

I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I | | I I | I I | I I I 
Db 6758 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6817 

Qy 6721 CCT C GAC CT CAT CAAGACAGGGC GTT CAGT GGT GCT GACAT CACACAGC AT GGAGGAGT G 6780 

I I I I M I I I II I I I I I I I I I I I I I I I I I I M II I I I I I I I I II I I II I I I I I I I I I I I I I 
Db 6818 C C T C GAC CT CAT C AAGACAGG GC GT T CAGT GGT G CT GAC AT C AC AC AG CAT G GAGGAGT G 6877 

Qy 67 81 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 684 0 

M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6878 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6937 

Qy 68 41 CAT C C AG CACC T GAAGAAC C GGT T T G GAG AT GGCTACAT GAT C AC GGT GC G GACCAAGAG 6900 

I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6938 CAT C CAG CAC CT GAAGAAC C G GT T T GGAGAT G GCT ACAT GAT C AC GGT GC G GACCAAGAG 6997 

Qy 6901 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 6960 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 6998 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 7057 

Qy 6961 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 7058 CAAGGAG C GGC AC C ACACAAAG GT GC AGT AC C AGCT C AAGT CGGAG C ACAT CT CG CT GG C 7117 

Qy 7021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 708 0 

I I M I I I I I I I I I I I I I I I I I I I I 1 I I I I I | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7118 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7177 

Qy 7081 CAGCC AGAC CACACT GGACAAT GT GT T C GT GAAC TT T GCCAAGAAGC AGAGT GACAAC CT 7140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 717 8 CAG C CAGAC CAC AC T G GACAAT GT GT T C GT GAACTT T GC CAAGAAGC AGAGT GACAAC CT 7237 

Qy 7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 72 00 

I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I || I I I || | | 
Db 723 8 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7297 

Qy 72 01 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7298 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7357 

Qy 72 61 G GAC C T G GAC AC G GAG GAC GAG GG CCT CAT CAGC TT C GAGGAGGAG C GG GC C CAGCT GT C 7320 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7358 G GAC CT G GAC AC GGAG GAC GAGG GC C T CAT C AGCT T C GAG GAG GAGC GG GC C C AGCT GT C 7417 

Qy 7321 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7380 

I I I I II I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 7418 CTT CAAC AC G GAC AC GCTCTGCT GAC CAC C CAGAGC T GG G C CAG G GAGGAC AC GCT C CAC 74 7 7 

Qy 7381 T GAC CAC C CAG AG C T G G G C CAG G GAC T C AA C AAT G G G G AC AG AAG T C C C C CAGT G C C T G C 744 0 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7478 T GAC CAC C CAGAG CT G GG C C AG GGACT CAACAAT GG G GAC AGAAGT C C C C CAGT G C C T GC 7537 

Qy 74 41 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 



Db 


7538 


CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 


7597 


Qy 


7501 


GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 


7560 






■ .■■I i » * i i i i j i i i i i i i i i i i i i i i i i i i i i I I i 1 i i i l i i i i 1 1 i 1 \ 1 1 

1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 I 1 1 1 1 1 1 1 1 II 1 M 1 1 




Db 


7598 


GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 


7657 


Qy 


7561 


GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 


7620 






1 I 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


7658 


GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 


7717 


Qy 


7621 


CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 


7680 




* i i i * i . * j j i i i i i i i i i i i i i i i i i i i i i i i i i i i 1 | 1 1 1 i | | 

1 I 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 




Db 


7718 


CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 


7777 


Qy 


7681 


TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 


7740 




| | | I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 




Db 


7778 


TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 


7837 


Qy 


7741 


GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 


7800 




1 1 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


7838 


GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 


7897 


Qy 


7801 


CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 


7860 




I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


7898 


CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 


7957 


Qy 


7861 


CT GGCAG GT G GC AG GAAT G GAGAAG C T GAC C CT GCT G GC CAGGCAAGG GGC C AGAC CC CC 


7920 




1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


7958 


CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 


8017 


Qy 


7921 


CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 


7980 




I I I 1 1 1 1 1 ! 1 i 1 1 1 I i 1 1 1 1 1 1 1 1 I 1 1 1 M 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


8018 


CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCCCCTCCC 


8077 


Qy 


7981 


T GGGAGCC GGGC CT GT ACATAGC GCACAGAT GTTT GTTTTAAATAAATAAACAAAATGT C 


8040 




1 1 1 1 I 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 




Db 


8078 


T G G GAG CCGGGCCT GT AC AT AG G G C AC AGAT GTTTGTTTT T AAT AAAT AAAC AAAAT GT C 


8137 


RESULT 


3 
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; GENERAL INFORMATION: 

; APPLICANT: Glucksmann, Maria A. 

; APPLICANT: Kapeller-Libermann, Rosana 

; TITLE OF INVENTION: No. US20030036074Alel Nucleic Acid Sequences Encoding 
Human Transporters, A Human 

; TITLE OF INVENTION: ATPase Molecule, A Human Ubiquitin Hydrolase-Like 
Molecule, A Human 

; TITLE OF INVENTION: Ubiquitin Conjugating Enzyme-Like Molecule, and Uses 
Therefor 

; FILE REFERENCE: 35800/247645 

; CURRENT APPLICATION NUMBER: US/ 10/ 156 , 2 39 

; CURRENT FILING DATE: 2002-05-24 

; PRIOR APPLICATION NUMBER: 09/795,693 



PRIOR FILING DATE : 2001-02-28 
PRIOR APPLICATION NUMBER: 60/185,906 
PRIOR FILING DATE: 2000-02-29 
PRIOR APPLICATION NUMBER: 09/809,557 
PRIOR FILING DATE: 2001-03-15 
PRIOR APPLICATION NUMBER: 60/192,018 
PRIOR FILING DATE: 2000-03-24 
PRIOR APPLICATION NUMBER: 09/808,568 
PRIOR FILING DATE: 2001-03-14 
PRIOR APPLICATION NUMBER: 60/191,790 
PRIOR FILING DATE: 2000-03-24 
PRIOR APPLICATION NUMBER: 09/808,767 
PRIOR FILING DATE: 2001-03-15 
PRIOR APPLICATION NUMBER: 60/191,781 
PRIOR FILING DATE: 2000-03-24 
NUMBER OF SEQ ID NOS : 60 

SOFTWARE: FastSEQ for Windows Version 4.0 
SEQ ID NO 7 
LENGTH: 8195 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE: 
NAME/ KEY: CDS 
LOCATION: (132) . . . (7442) 
US-10-156-239-7 

Query Match 99.9%; Score 8032; DB 15; Length 8195; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 8035; Conservative 0; Mismatches 5; Indels 0; Gaps 0; 

Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I 
Db 98 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 157 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I M II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 158 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 217 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 218 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 277 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 278 CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 337 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 30 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I 
Db 338 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 397 

Qy 301 CAACT C C AC GGT C AC GCAG CT GCT T GAG C GC CT GGAC C GC GT G GT GGAGGAAG GCAACC T 360 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 398 CAACT CCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 457 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 420 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 458 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 517 



Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 

I II I I I I I I I I I I I I I I I I I I I I II I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 518 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 577 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

I I I I I I I I M I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I II I I I I I I I 
Db 578 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 637 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63 8 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 697 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 698 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 757 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 72 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 758 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 817 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 780 

I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I II I II 
Db 818 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 877 

Qy 781 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 87 8 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 937 

Qy 841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I 
Db 938 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 997 

Qy 901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 9 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 998 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1057 

Qy 961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1058 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1117 

Qy 1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1118 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1177 

Qy 1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 117 8 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1237 

Qy 1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1238 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1297 

Qy 1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 129 8 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1357 



Qy 1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1358 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1417 

Qy 1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1418 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1477 

Qy 1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I 
Db 147 8 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1537 

Qy 1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1538 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1597 

Qy 1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1598 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1657 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I 
Db 1658 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1717 

Qy 1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I I I II II 
Db 1718 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1777 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 177 8 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1837 

Qy 1741 C CAGTT CAT GT CCAAGGT GAGC GT GGACAT CTT CAAGGGCTT CC C CGACGAGGAGAGCAT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 183 8 C C AGT T CAT GT C CAAGGT GAG C GT GGACAT CTT CAAG GGCTTCCCC GAC GAGGAGAGCAT 1897 

Qy 1801 T GT C AAC T AC AC C C T C AAC C AG G C CT AC C AGG AC AAC GT C AC TGTTTTTGC C AGT GT GAT 1860 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I 
Db 1898 T GT C AACT AC AC C CT CAAC C AG G C CT AC C AGGACAAC GT C ACT GT T T T T GC C AGT GT GAT 1957 

Qy 18 61 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1958 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 2017 

Qy 1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 198 0 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 
Db 2018 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2 077 

Qy 1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 078 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2137 

Qy 2041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2138 C GC C AT CAT C GAC ACT TTTGTGGGG C AC GAC GT GGT G GAGC CAG GC AGCT ACGT G CAGAT 2197 

Qy 2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 



II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II I II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

Db 2198 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2257 

Qy 2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 222 0 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 225 8 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2317 

Qy 2221 G GAGAAGGAGCAC C GGCT C AAG GAG GT GAT GAAGAC CAT GG GC CT GAAC AAC GC GGT GC A 2280 

I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2318 G GAGAAGGAGCAC C GGCT CAAGGAG GT GAT GAAGAC CAT GG GC CT GAACAAC GC GGT GC A 2377 

Qy 22 81 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I 
Db 2378 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2437 

Qy 2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 4 38 CGCCATCCTGAAGTACGGCCAGGTGCTTATACACAGCCACGTGGTCATCATCTGGCTCTT 24 97 

Qy 24 01 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 60 

I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I 
Db 2498 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2557 

Qy 2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2558 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2617 

Qy 2521 CAT GT AC GT GGC GAT CC GAGAG GAG GT GGC GC AT GAT AAGAT CAC GGC CT T C GAGAAGT G 258 0 

I II I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2618 CAT GT AC GT GGC GAT CC GAGAG GAG GT GGC G CAT GAT AAGAT C AC GG C CT T C GAGAAGT G 2 677 

Qy 2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 640 

II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I 

Db 2 67 8 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2737 

Qy 2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 273 8 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2797 

Qy 27 01 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

Db 2798 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 28 57 

Qy 2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 282 0 

II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 2858 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2917 

Qy 2 821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 8 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2918 CTT C CC ACT GCAGAAGT CCTACT GGCT GGGCAGT GGGCGGAC AGAAGC CT GGGAGT GGAG 2 977 

Qy 2881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2 940 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I 

Db 2 97 8 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3037 

Qy 2941 G GAGAGC C GGC GCTT T GAGG AGAC C C GT GGCAT G GAGGAGGAG C C CAC C C AC CT GC CT CT 3000 

I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I M I I I I I I I I I II I I I I I I I I I I I I I 



Db 3038 G GAGAGC C GGC G CT T T GAGGAGAC C C GT G G CAT G GAGGAG GAGC CCAC CCAC CT G C CT C T 3097 

Qy 3001 G GT T GT CT G C GT GGACAAACT CAC CAAGGT CT ACAAGGAC GACAAGAAGCT GG C C C T GAA 3060 

I I I II I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3098 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3157 

Qy 3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

i I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3158 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3217 

Qy 3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3218 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3277 

Qy 3181 CAC CAT CT ACGGGCAC GAC AT CC G CAC GGAGAT GGAT GAGAT C C G CAAGAAC C T GG GC AT 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 3278 CAC CAT CT AC GGGC AC GAC AT C C G CAC GGAGAT GGAT GAGAT C C G CAAGAAC C T GG GC AT 3337 

Qy 3241 GT G C C C GCAGCAC AAT GTGCTCTTT GACC G GCT CAC GGT G GAGGAAC AC CT C T GGT T C T A 3300 

I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3338 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3397 

Qy 3301 CT CAC GGCT C AAGAG C AT GG CT C AGGAGGAGAT CC GCAGAGAGAT GGACAAGAT GAT C GA 3360 

I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 3398 CT CACGGCT CAAGAG CAT GG CT C AGGAGGAGAT C C GCAGAGAGAT GGACAAGAT GAT C GA 3457 

Qy 3361 G GAC CT GGAGCT CT C CAACAAAC G GC ACT C ACT GGT GCAGAC AT T GT CG G GT GGCAT GAA 342 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3458 G GAC CT GGAGCT CT C CAACAAAC G GC ACT C ACT G GT GCAGAC AT T GT C G G GT GGCAT GAA 3517 

Qy 3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3518 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3577 

Qy 34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 357 8 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3637 

Qy 3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 360 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I 
Db 3 638 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3697 

Qy 3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 3698 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3757 

Qy 3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I 
Db 3758 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3817 

Qy 3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3818 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3877 

Qy 3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3878 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3937 



Qy 38 41 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I II I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
Db 3938 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3997 

Qy 3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 3 998 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4057 

Qy 3961 G CT GAT G GAC AC GAC C C T GGAG GAAGT GT T C CT CAAGGT GT C GGAG GAG GAT C AGT C GCT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4058 G CT GAT GGAC AC GAC C C T GGAG GAAGT GT T C CT CAAGGT GT C GGAGG AG GAT C AGT C GCT 4117 

Qy 4021 G G AG AAC AG T GAG G C C GAT G T G AAG G AGT C C AG G AAG GAT GTGCTCCCTGGGGCG GAG G G 4 080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 4118 G GAGAACAGT GAG G C C GAT GT GAAGGAGT C C AG GAAG GAT GT GC T C C CT GGGG CG GAG GG 4177 

Qy 4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 417 8 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4237 

Qy 4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 42 38 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4297 

Qy 42 01 C T AC AC C GAC GT C T AT G GC GAC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AGAC AA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4298 C T AC AC C GAC GT C T AT G GC GAC T AC CGCCCCCTCTTT GAT AAC C C AC AG GAC C C AGAC AA 4357 

Qy 4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I 
Db 4358 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4417 

Qy 4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I I I 
Db 4418 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4477 

Qy 43 81 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4 44 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4478 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4537 

Qy 4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4 500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4538 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4597 

Qy 4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 

Db 4598 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4657 

Qy 4 561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 620 

I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 65 8 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4717 

Qy 4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 468 0 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I 

Db 4718 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4777 



Qy 4 681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 4778 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4837 

Qy 4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 00 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I | I I I 
Db 4 838 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 97 

Qy 4 8 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 48 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 
Db 4898 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4957 

Qy 4861 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4 958 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 5017 

Qy 4 921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4 980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5018 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 5077 

Qy 4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | I | | | | | 
Db 5078 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5137 

Qy 5041 CAT CCT GAC C GAC AT CAC C G G C CAC AAT GT CT CT GAGT AC CT GCT CT T C AC CT C C GAC C G 5100 

I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 5138 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5197 

Qy 5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I 
Db 5198 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5257 

Qy 5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5258 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5317 

Qy 5221 G GT TT T C TACAACAACAAGGGC T AT CAC AGC AT G CC CAC CT AC CT CAAC AG C CT CAAC AA 52 8 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I II I I I I I 

Db 5318 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5377 

Qy 5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 
Db 5378 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5437 

Qy 5341 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 5438 C GT CAC CAAC CAC C C CAT GAAT AAGAC C AGC GC CAG CCTCTCCCT GGAT T AC C T GC T G C A 54 97 

Qy 5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 5498 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5557 

Qy 5461 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I I I M I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I || | | I | | | | | | | || | I | | 

Db 5558 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5617 

Qy 5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 558 0 



Db 5618 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5677 

Qy 5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 567 8 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5737 

Qy 5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5738 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5797 

Qy 57 01 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 5798 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5857 

Qy 5761 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I 
Db 585 8 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5917 

Qy 5821 CGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTT 5880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5918 C GAGC AC GAC AAG GAC CT GAAGGT T GT CAAC AGT T ACC T GAAAAG CT G CT T C C T CAT T T T 5977 

Qy 58 81 C C C CAAC TACAAC CT G G G C C AC G G GCT C AT GGAGAT GG C CT AC AAC GAGT ACAT CAAC GA 5940 

I I I I I I I I I I I I II I I II I I II I I I I I I II I I I I I I I II I I I II I I I I I I I I I I I I I I I I 
Db 5978 C C C CAAC TACAAC CT GGG C CAC GGG CT CAT GGAGAT GG C C TACAAC GAGTAC AT CAAC GA 6037 

Qy 5941 GT AC T AC GC C AAGAT T G GC C AG T T T GAC AAG AT GAAGT CCCCGTTC GAGT G G GAC AT T G T 6000 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I II I I I I I I II I I I I I 
Db 6038 GT ACT AC GC C AAGAT T G G C CAGT T T GAC AAGAT GAAGT CCCCGTTC GAGT G GG AC AT T GT 6097 

Qy 6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6098 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6157 

Qy 60 61 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 6158 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6217 

Qy 6121 GGAT GAT GT GGAC GT GGCCAGT GAGC GGCAGC GAGT GCTCCGGGGAGACGCCGACAAT GA 6180 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 6218 G GAT GAT GT G GAC GT G G C CAGT GAG C G G C AG C GAGT GCTCCGGG GAG AC G C C G AC AAT G A 6277 

Qy 6181 CAT GGT CAAGAT T GAGAACCT GAC CAAGGT CT ACAAGT C CC GGAAGATT GGCC GT AT C CT 6240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 
Db 6278 CAT GGT CAAGAT T GAGAAC C T GAC CAAGGT CT ACAAGT C C C G GAAGATT GG C C GT AT C C T 6337 

Qy 6241 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6300 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I 
Db 6338 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6397 

Qy 63 01 CAAC GGT GC GGGC AAGAC C AG CAC CT T CAAGAT GCT GAC C GGC GAC GAG AG CAC GAC GGG 6360 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 63 98 CAAC G GT GC GGGCAAGAC C AGC AC CT T CAAGAT GCT GAC C G G C GAC GAGAG CAC GAC GG G 6457 

Qy 6361 GGGC GAG GCCTTCGT C AAT G GAC AC AG C GT G C T G AAG GAG C T G C T C C AG GT G C AG C AG AG 6420 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I 



Db 645 8 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6517 

Qy 6421 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6480 

I I I I I I I I I I I I I I I I I M I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6518 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6577 

Qy 64 81 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I II I I I I I I I I I I 
Db 657 8 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6637 

Qy 6541 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | M I 
Db 6638 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6697 

Qy 6601 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I 
Db 6698 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6757 

Qy 6661 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6720 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 67 5 8 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6817 

Qy 6721 CCT C GAC CT CAT CAAGAC AGG GC GT T CAGT GGT GCT GACAT C AC AC AG C AT GGAGGAGT G 6780 

I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I 
Db 6818 C CT C GAC C T CAT CAAGAC AGGGC GTT CAGT G GT G CT GACAT CAC AC AGC AT GGAGGAGT G 6877 

Qy 6781 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 684 0 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I II I I I 
Db 68 7 8 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6937 

Qy 6841 CAT C CAG C AC CT GAAGAAC C GGT T T GGAGAT GGCT ACAT GAT CAC GGT G C GGAC CAAGAG 6900 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I M I I I I I I I II I I I I I I I I II I I I I 

Db 6938 CAT C CAG CAC CT GAAGAAC C G GT T T GGAGAT GGCT ACAT GAT CAC G GT G C GGAC CAAGAG 6997 

Qy 6901 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 6960 

I M I I I I I I I 1 I I 1 I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I | I | | 1 
Db 699 8 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 7 057 

Qy 6961 CAAG GAGC GGCACC AC ACAAAG GT GCAGT AC CAGCT CAAGT C G GAG CAC AT C T CG CT GGC 7020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 7058 CAAG GAGC G G CAC CAC ACAAAG GT GCAGT AC CAG CT CAAGT C GGAGC ACAT CTCGCTGGC 7117 

Qy 7021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 708 0 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I 
Db 7118 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7177 

Qy 70 81 C AGC C AGAC CAC AC T G GACAAT GT GT T C GT GAACTT T GCCAAGAAGC AGAGT GAC AAC CT 7140 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 717 8 CAGC CAGAC CAC AC T G GACAAT GT GT T C GT GAACT T T GCCAAGAAGC AGAGT GACAAC C T 7237 

Qy 7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7238 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7297 

Qy 7201 

Db 7298 



CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 72 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7357 



Qy 7261 G GAC CT GGAC AC G GAG GAC GAGG G C C T CAT CAGCT T C GAG GAG GAG C G G G C C C AG C T GT C 7320 

I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7358 GGAC C T GGAC AC G GAGGAC GAGG G C C T CAT CAG CT T C GAGGAGGAGC G G G C C C AG CT GT C 7417 

Qy 7321 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7380 

I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I 
Db 7418 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 7477 

Qy 7381 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7478 T GAC CAC C CAGAG C T G G GC C AGGGACT C AACAAT G G GGAC AGAAGT C C C C C AGT G C CT G C 7537 

Qy 7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 7538 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7597 

Qy 7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 759 8 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7657 

Qy 7561 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 7658 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7717 

Qy 7621 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7 68 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7718 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7777 

Qy 7 681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7740 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7778 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7837 

Qy 7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7838 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7897 

Qy 7801 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7860 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 7898 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7957 

Qy 78 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7 92 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7958 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 8017 

Qy 7921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7 98 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 8018 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCCCCTCCC 8 077 

Qy 7981 T G G G AGC C G G G C CT GT AC AT AG C G CAC AGAT GTTTGTTT T AAAT AAAT AAAC AAAAT GT C 8 04 0 

I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8078 T G G G AGC C G G G C C T GT AC AT AGG G CAC AGAT GT TT GTT TT TAAT AAAT AAACAAAAT GT C 8137 
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CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M | I | | 
CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 157 

GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 12 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 217 

CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | I I I I I I I I I I I I I I I I 
CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 277 

CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 24 0 
I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 337 

TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I II I I I 
TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 397 

CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | | | | | | | | II I I 
CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 4 57 

GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 
I I I I M I I I I I I I I I I I I I I | I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | M II I I I 



Qy 


1 


Db 


98 


Qy 


61 


Db 


158 


Qy 


121 


Db 


218 


Qy 


181 


Db 


278 


Qy 


241 


Db 


338 


Qy 


301 


Db 


398 


Qy 


361 


Db 


458 



Qy 



421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 48 0 



1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 i 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 

Db 518 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 577 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCA7VAA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I M I I I II I I I I I I I I I I I I I I 

Db 57 8 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 637 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I I I I I I I I I I I I II I I II I I I II I I I I I II I I II I I I I I I I I I I I I I II I I I I I I 
Db 638 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 697 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

I I I M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 698 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 757 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 72 0 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 758 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 817 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 78 0 

I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 818 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 8 77 

Qy 781 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 878 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 937 

Qy 841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 938 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 997 

Qy 901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 998 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1057 

Qy 9 61 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1058 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1117 

Qy 1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 108 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1118 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1177 

Qy 1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

I I I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1178 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1237 

Qy 1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1238 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1297 

Qy 12 01 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 12 60 

I M I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1298 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1357 

Qy 1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



Db 1358 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1417 

Qy 1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1418 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1477 

Qy 1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 7 8 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1537 

Qy 14 41 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I | I I I 
Db 1538 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1597 

Qy 1501 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 1598 TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1657 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I II I | | | | | | 
Db 1658 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1717 

Qy 1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1718 AC T GAAC CT GT C ACT GGAT GAG CT GC C G C C GG CC CT GAGACAGGACAAC TT CT CGCT GC C 1777 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1778 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1837 

Qy 1741 C C AGT T CAT GT C C AAG GT GAG C GT GGAC AT CT T C AAGG GCTTCCCC GAC GAG GAGAGC AT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1838 C CAGT T CAT GT C CAAG GT GAGC GT GGACAT CT T CAAG GG CT T C C C C GAC GAGGAGAGC AT 1897 

Qy 18 01 T GT CAACT AC AC C CT CAAC C AGGC CT AC CAGGACAAC GT C ACT GT TT TT GC C AGT GT GAT 1860 

I I I M I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I II I I I II I I I I 
Db 18 98 TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 1957 

Qy 18 61 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | I | | 

Db 1958 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 2 017 

Qy 1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 198 0 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2018 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2077 

Qy 1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 040 

I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 07 8 TACT GGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCT GGAT CCAGGACAT GAT GGAGCG 2137 

Qy 2 041 C G C CAT CAT C GAC AC TTTTGTGGGG C AC GAC GT G GT G GAG C C AGG C AGC T AC GT G C AG AT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2138 C GC CAT CAT C GAC AC TTTTGTGGG GC AC GAC GT G GT G GAG C C AGGC AGC T AC GT G CAG AT 2197 

Qy 2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

M I I I I I I I I I I I M I I I I I I I I I I I I I I || I I I I I I I || I I I I I I I I I I I I I I I I I I I I 
Db 2198 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2257 



Qy 2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACGATCCAGCACATCGTGGC 2220 

I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2258 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2317 

Qy 2221 GGAGAAG GAGC AC C G G CT C AAG GAGGT GAT GAAGAC C AT GGG C C T G AAC AAC G C G GT G C A 2280 

I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2318 GGAGAAGGAGC AC C G G CT CAAG GAG GT GAT GAAGAC CAT GGG CC T GAAC AAC G C G GT G C A 2377 

Qy 2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2378 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2437 

Qy 2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2438 CGCCATCCTGAAGTACGGCCAGGTGCTTATACACAGCCACGTGGTCATCATCTGGCTCTT 24 97 

Qy 2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | | | | | | | | 
Db 2498 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2557 

Qy 2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | 
Db 2558 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2617 

Qy 2521 CAT GT ACGT GGCGAT CC GAGAGGAGGT GGC GCAT GATAAGAT CACGGCCTT CGAGAAGT G 2580 

I M I I I I M M I I I I II I I I I I I I I I I I I I I I I I | | | | M II I II I I I I I I I I I 

Db 2 618 CAT GT AC GT GGCGAT C C GAGAGGAGGT GGC GCAT GATAAGAT C AC G G C CT T C G AGAAGT G 2677 

Qy 2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 264 0 

I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I II I I I I | I | | | | I | | | | | | | | 
Db 2678 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2737 

Qy 2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

I I M I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

Db 2738 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2797 

Qy 2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I 

Db 2798 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2857 

Qy 27 61 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | || | | 
Db 2858 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2917 

Qy 2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 918 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2977 

Qy 2 8 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 2940 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2 97 8 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3037 

Qy 2 941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3038 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3097 



Qy 3 001 G GT T GT CT G CGT GGACAAACT C AC CAAG GT CT ACAAGGAC GACAAGAAG CTGGCCCT GAA 3060 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I | | I I I I I I 
Db 3 09 8 GGTTGTCTGCGTG GAC AAACT C AC CAAGGT CT ACAAGGAC GACAAGAAGCT G G CC CT GAA 3157 

Qy 3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 312 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 3158 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3217 

Qy 3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 3218 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3277 

Qy 3181 CAC CAT CTACGGGCACGACAT C C GCAC GGAGAT GGAT GAGAT CCGCAAGAACCT GGGCAT 3240 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I | I I I I I I 
Db 3278 CAC CAT C TAC G GG CAC GACAT C C G CAC G GAGAT GGAT GAGAT C C G CAAGAAC C T G GGCAT 3337 

Qy 3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3338 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3397 

Qy 3301 CTCAC GGCT CAAGAGCATGGCT CAGGAGGAGATCCGCAGAGAGAT GGACAAGATGAT CGA 3360 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3398 CT CAC GG CT CAAGAG CAT GGCT C AG GAG GAGAT C CG CAGAGAGAT GGAC AAGAT GAT C GA 3457 

Qy 3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3458 G GAC CT G GAGCT CT C CAACAAAC G G CACT CAC T GGT G CAGAC AT T GT C GGGT GGCAT GAA 3517 

Qy 3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 

Db 3518 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3577 

Qy 34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3540 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 3578 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3637 

Qy 3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3638 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3697 

Qy 3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 3698 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3757 

Qy 3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3758 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3817 

Qy 3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 3818 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3877 

Qy 3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3878 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3937 

Qy 3841 AGAC AC AAG CAC G GAG C T C T C C TAC AT C C T G C C C AG C GAG G C C G C C AAG AAG GGGGCTTT 3900 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I II II M 1 1 I I I I I 1 1 I I l I II II I I I l 1 1 l l I l l I I I I I I I I l l l l I l ll l l I 1 1 I l I I 

3938 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3997 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 39 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3998 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4057 

3 961 GC T GAT G GACACGAC C CT GGAGGAAGT GT T CCT C AAGGT GT C GGAG GAG GAT C AGT C GC T 4020 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
4058 GC T GAT G GACACGAC C C T G GAG GAAGT GT T C C T CAAGGT GT C G GAGGAG GAT CAGT C GCT 4117 

4021 G GAGAAC AGT GAG G C C GAT GT GAAGGAGT C C AGGAAG GAT GTGCTCCCTGGGGCG GAG G G 4080 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4118 G GAGAAC AGT GAG GC C GAT GT GAAGGAGT C CAGGAAGGAT GT GC T C C CT G GGG CGGAGG G 4177 

4 081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

I I I I I I I I I 1 I I I I I I I I I I I II I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 
4178 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4237 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I 
4238 G CAGG CAT C GCT G CAGT C G GCGT CAT CTGTGGGCTCTGCCCGTGGCGAC GAG GGAGCTGG 42 97 

4201 C T AC AC C GAC G T C TAT G G C G AC T AC CGCCCCCTCTTT G AT AAC C C AC AG G AC C C AG AC AA 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
4298 CT ACAC C GACGT CT AT G GC GAC T AC CGCCCCCTCTTT GAT AAC C CAC AG GAC C CAGACAA 4357 

4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

4358 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4 417 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
4418 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4477 

4 381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
4478 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4537 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I I I I 

4538 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4597 

4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

I I I I I I I I I II I I I I I I I I I I I I I I I i I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I 
4598 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4657 

4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I 
4658 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4717 

4 621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
4718 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 777 

4 681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 4 77 8 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4837 

Qy 4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 00 

I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 4 838 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 897 

Qy 4 8 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 48 60 

I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4898 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 957 

Qy 4 861 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 958 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 5017 

Qy 4921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 4980 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5018 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 5077 

Qy 4 981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 504 0 

I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 5078 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5137 

Qy 5041 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5100 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5138 CAT C C T GAC CGAC AT C AC C GGC C ACAAT GT CT CT GAGT AC CTGCTCTT C AC CT C C GAC C G 5197 

Qy 5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I I I I I II I I I II I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5198 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5257 

Qy 5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 522 0 

I II I II I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I 
Db 5258 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5317 

Qy 5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5318 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5377 

Qy 52 81 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 534 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I II I I I I I I I I I 
Db 5378 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5437 

Qy 5341 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 54 00 

I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5438 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5497 

Qy 5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 5498 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5557 

Qy 5461 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5520 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M II | I I I | 

Db 5558 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5617 

Qy 5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 558 0 

I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5618 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5677 



Qy 5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I M I I I I I I I I I I 

Db 567 8 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5737 

Qy 5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5738 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5797 

Qy 5701 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5798 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5857 

Qy 57 61 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5858 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5917 

Qy 5821 CGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTT 5880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 5918 C GAG CAC GACAAG GAC CT GAAGGT T GT CAACAGT T AC CT GAAAAG C T G C T T C CT C AT TT T 5977 

Qy 58 81 CCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCT^ACGA 5940 

I I I I I I I I I I I I I I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 597 8 C C C CAAC TACAAC CT GG GC CAC GGGC T C AT GGAGAT GG C C T ACAAC GAGT ACAT C AAC GA 6037 

Qy 5941 GTACT AC G C CAAGAT T GG C C AGT T T GAC AAGAT GAAGT C C C C GT T C GAGT G G GAC AT T GT 6000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6038 GTAC T AC GC CAAGAT T GG C C AGT T T GACAAGAT GAAGT CCCCGTTC GAGT G G GAC AT T GT 60 97 

Qy 6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 6098 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6157 

Qy 6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 615 8 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6217 

Qy 6121 GGAT GAT GT GGAC GT GGC CAGT GAGC GG CAGC GAGT GC T C C G GG GAGAC GC C GAC AAT GA 618 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I 

Db 6218 GGAT GAT GT GGAC GT GGC CAGT GAGC GGCAGC GAGT GCT C C G GG GAGAC GC C GAC AAT GA 6277 

Qy 6181 CAT G GT CAAGAT T G AGAAC C T GAC C AAG GT CT AC AAGT C C C G GAAG AT T G G C C GT AT C C T 6240 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 627 8 CAT GGT CAAGAT T GAG AAC CT GAC CAAGGT CTACAAGT CCC GGAAGATT GGCCGT AT CCT 6337 

Qy 6241 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 63 00 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 6338 GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 6397 

Qy 6301 CAACGGT GC GG GC AAGAC C AG CAC CT T CAAGAT G CT GAC C GG C GAC GAGAGCAC GAC GG G 6360 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 6398 CAAC GGT GC GG GC AAGAC C AG CAC CT T CAAGAT GCT GAC C G G C GAC GAGAG CAC GAC GGG 6457 

Qy 6361 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6420 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 645 8 GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 6517 



Qy 6421 CCT CGGCTACT GCCCGCAGT GT GACGCGCTGTT CGACGAGCT CACGGCCCGGGAGCACCT 648 0 

I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 
Db 6518 CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 6577 

Qy 64 81 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 654 0 

I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 6578 GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 6637 

Qy 6541 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6600 

I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6638 GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 6697 

Qy 6601 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6660 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I 
Db 6698 CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 6757 

Qy 6661 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 6758 CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 6817 

Qy 6721 C C T C G AC C T CAT C AAG AC AG G G C GT T C AG T G GT G C T G AC AT C AC AC AG CAT G GAG GAG T G 678 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 6818 CCT C GACCT CAT CAAGACAGGGC GTT CAGT GGT GCT GACAT CACACAGCATGGAGGAGT G 6877 

Qy 67 81 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 684 0 

I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6878 CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 6937 

Qy 6841 CAT CCAGCACCT GAAGAAC CGGTTTGGAGAT GGCTACAT GAT CAC GGT GCGGACCAAGAG 6900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6938 CAT C CAGC AC CT GAAGAAC C G GT T T G GAGAT GG CT ACAT GAT CAC GGT G C GGAC C AAGAG 6997 

Qy 6901 CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 6960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6998 CAGC CAGAGTGTGAAGGACGT GGT GC GGT TCTTCAACCGCAACTTCCCGGAAGCCAT GCT 7057 

Qy 6961 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7020 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 058 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7117 

Qy 7021 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7080 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 7118 CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7177 

Qy 7 081 C AG C CAGAC C ACACT G GACAAT GT GT T C GT GAACTT T G CCAAGAAGC AGAGT GAC AAC CT 714 0 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7178 C AG C CAGAC C ACACT G GACAAT GT GT T C GT GAACT T T G C CAAGAAGC AGAGT GACAAC CT 7237 

Qy 7141 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7238 GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7297 

Qy 7201 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 72 60 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 72 9 8 CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7357 

Qy 7261 G GAC C T G GAC AC G GAG GAC GAG G G C C T CAT C AG C T T C GAG GAG GAG C G G G C C C AG C T GT C 7320 



Db 



7358 



7417 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 



7321 C T T CAAC AC GGAC AC GCTCTGCT GAC CAC C C AGAGCT G GGC C AG G GAGGAC AC GCT C C AC 73 8 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
7418 CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 747 7 

7381 T GAC CAC C C AG AG C T G G G C C AG G GAC T C AAC AAT G G G G AC AG AAGT C C C C C AGT G C C T G C 74 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7478 TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7537 

7441 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7538 CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 75 97 

7501 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7560 

I I I II I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7598 GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCC 7657 

7561 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7620 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
7 658 GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCG 7717 

7 621 CCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCC 7 680 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7718 CCCCTGCCTGGCACT GCT CACCGCCCAAGGCGACGCCGGCT GGAC CAGGCACT GCT GGCC 7777 

7681 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 774 0 

I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
777 8 TTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGA 7 837 

7741 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7 800 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
7838 GCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCT 7 897 

7801 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7 860 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
7 898 CTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAG 7 957 

7 8 61 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 7 92 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
7958 CTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCC 8017 

7 921 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCC 7 98 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

8018 CCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCCCCTCCC 8 077 

7981 TGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATAAACAAAATGTC 8040 

I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

8 07 8 T G G GAG CCGGGCCT G T AC AT AG G G CAC AG AT GTTTGTTTT T AAT AAAT AAAC AAAAT GT C 8137 
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Query Match 99.2%; Score 7973.2; DB 16; Length 8037; 

Best Local Similarity 99.7%; Pred. No. 0; 

Matches 8003; Conservative 0; Mismatches 3; Indels 18; Gaps 1; 

Qy 35 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 60 

Qy 95 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I II I I I I I I 1 I I I I I I I I I I I I I 
Db 61 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 12 0 

Qy 155 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCG 214 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I t I I I I I I I 
Db 121 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCG 18 0 

Qy 215 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 181 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 240 

Qy 275 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I 
Db 241 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 300 

Qy 335 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 394 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 301 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 360 

Qy 395 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 454 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 361 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 42 0 



Qy 



455 C AC CT GGACAGAT C CACAGT GTCTTCCTTCTCTCTG GACT C GGT G GC CAGAAACCC GC AG 514 



Db 



421 



480 



Qy 515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 57 4 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 481 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 54 0 

Qy 575 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 634 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I | I I I 
Db 541 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 600 

Qy 635 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 660 

Qy 695 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 754 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 72 0 

Qy 755 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGT^AGGGAGCC 814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 78 0 

Qy 815 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 8 74 

I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 84 0 

Qy 875 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I 1 I I I I I I I 1 I I I I I I I I I I I 
Db 841 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 900 

Qy 935 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 9 94 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I 
Db 901 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 960 

Qy 995 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1020 

Qy 1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1080 

Qy 1115 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1174 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 114 0 

Qy 1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1200 

Qy 1235 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1294 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1260 

Qy 12 95 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



Db 1261 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCTTGGGCTTCACG 1320 

Qy 1355 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 1414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 1321 AG CAAGAAGCAG C G GAAC CTGGGCCTCCTC GT GC ACCT CAT GAC C AG CAAC C C CAAAAT C 1380 

Qy 1415 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1381 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 144 0 

Qy 1475 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1441 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1500 

Qy 1535 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

I II I I I I I I I I I I I I I I I I I I II I II I II I I I II II I I I I I I I I I I I I I I I I I I I I I II I 
Db 1501 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1560 

Qy 1595 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1561 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 162 0 

Qy 1655 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 1621 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 168 0 

Qy 1715 AT T GAC AAC GC GGC CT GC GGC T GGAT C C AGT T CAT GT C CAAG GT GAGC GT GGAC AT C T T C 1774 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 174 0 

Qy 1775 AAGG G CT T C C C C GAC GAG G AGAGC AT T GT CAACT AC AC C CT CAAC C AG GC CT AC CAG GAC 1834 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 AAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGAC 18 00 

Qy 1835 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 1801 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 1860 

Qy 18 95 CACGT GCACTACAAGAT CCGC CAGAACT CCAGCTT CACCGAGAAAACCAACGAGATC CGC 1954 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CACGT GCACTACAAGATCC GCCAGAACT CCAGCTT CACCGAGAAAACCAACGAGAT CCGC 1920 

Qy 1955 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2014 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1921 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 198 0 

Qy 2 015 GT CT GGAT C C AGGAC AT GAT G GAG C G C GC C AT CAT C GAC ACT T T T GT GGGGC AC GAC GT G 2 074 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 GT CT GGAT C C AGGAC AT GAT G GAG C G C GCC AT CAT C GACACT T T T GT G GGGC AC GAC GT G 2 04 0 

Qy 2075 GT G GAGC CAG G CAG C T AC GT G C AGAT GT T C C C C T AC C C CT GC T AC AC AC GC G AT GAC T T C 2134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2100 

Qy 2135 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2194 

I I I I I I I I I I I I II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2160 



Qy 2195 G C CAT G AC CAT C C AGC ACAT C GT G GC GGAGAAG GAGC AC C G G CT C AAG GAG GT GAT G AAG 2254 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I 
Db 2161 GC CAT GAC CATC CAGCACAT CGT GGC GGAGAAGGAGCACCGGCT CAAGGAGGT GAT GAAG 2220 

Qy 2255 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2280 

Qy 2315 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2374 

I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I 
Db 2281 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2340 

Qy 2375 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2434 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2400 

Qy 2435 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 24 94 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I I I 
Db 2401 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2460 

Qy 2495 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 2554 

I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I II I I II I I I I I I I I I I I I I 

Db 2461 AT CT ACT T CCT GAG CT AC GT G C C CT ACAT GT AC GT GG C GAT C CGAGAG GAGGT G G C G CAT 2520 

Qy 2555 GATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGT 2614 

II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 2521 GATAAGAT C AC G GC C T T C GAGAAGT GC AT CGCGTCCCT CAT GT C C AC GAC G GC CT T T GGT 258 0 

Qy 2615 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2674 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 25 81 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2 64 0 

Qy 2675 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2641 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2700 

Qy 2735 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2794 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 27 01 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2760 

Qy 2795 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2 854 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 61 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2 820 

Qy 2 855 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2 914 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 821 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 288 0 

Qy 2 915 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 2 974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 2940 

Qy 2975 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2941 GAG GAG GAGC C C AC C CAC CTGCCTCTGGTTGTCTGCGTG GACAAAC T C AC CAAG GT CT AC 3000 



Qy 3035 AAG GAC GAC AAGAAG CT G GC C CT GAACAAG CT GAGC C T GAAC CT CT AC GAGAAC CAGGT G 3094 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 3001 AAG GAC GACAAGAAGCT GGC C CT GAACAAG C T GAGC C T GAAC CT CT AC GAGAAC CAGGT G 3 060 

Qy 3095 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 3154 

II I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 3120 

Qy 3155 CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 3214 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 3180 

Qy 3215 GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 3274 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 3181 GAT GAGAT CC GCAAGAACCT GGGCAT GT GCCCGCAGCACAAT GT GCT CT TT GACC GGCT C 3240 

Qy 3275 AC G GT GGAG GAACAC C T CT G GT T CT ACT CAC GGCT CAAG AG CAT GGCT C AG GAG GAGAT C 3334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 3241 AC G GT GGAG GAAC AC CT CT GGT T CTACT CAC GGCT CAAGAGCAT GGC T C AG GAGGAGAT C 3300 

Qy 3335 C G C AG AG AGAT G GAC AAG AT GAT C GAG GAC C T G GAG C T C T C C AAC AAAC G G CAC T CAC T G 3394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3301 C GCAGAGAGAT GGACAAGATGAT CGAGGAC CT GGAGCT CT CCAACAAAC GGCACT CACT G 3360 

Qy 3395 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 3454 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 33 61 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 342 0 

Qy 3455 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 3514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 3480 

Qy 3515 GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCAC 3574 

I I I I I I I I I I I I I I I II I I I I I I I II I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 34 81 GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCAC 354 0 

Qy 3575 CACAT GGATGAGGCT GACCT GCTT GGGGACCGCAT TGCCATCAT CT C CCATGGGAAGCT C 3634 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 CACAT GGAT GAG GCT GAC CT G CT T GG GGAC C G CAT T GC CAT CAT CT C C C AT GGGAAGCT C 3 600 

Qy 3635 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3694 

I I I I I I I I I I I II I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I 
Db 3601 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3660 

Qy 3695 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 3754 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I II I I I I I I I I 

Db 3661 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 3720 

Qy 3755 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 3814 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 3780 

Qy 3815 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 3874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I II I I I I I I I I I I I II I I I I I I 
Db 37 81 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 384 0 

Qy 3 875 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3934 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II I 

Db 38 41 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3900 

Qy 3935 GATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTC 3994 

I I I I I I II I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I 
Db 3901 GATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTC 3960 

Qy 3995 AAGGT GT C GGAGGAGGAT C AGT C GCT GGAGAAC AGT GAG GC CGAT GT GAAGGAGT C C AGG 4054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 39 61 AAGGT GT C GGAG GAG GAT C AGT C G C T GGAGAACAGT GAG GC C GAT GT GAAG GAGT C C AGG 4020 

Qy 4055 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 021 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 408 0 

Qy 4115 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 4174 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 4 081 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 414 0 

Qy 4175 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4234 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 42 00 

Qy 4235 TT T GAT AACC C AC AGGAC C C AGACAAT GT CAGC CT GCAAGAG GT G GAG G CAG AG GC C CT G 4294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 4201 T T T GAT AAC C C AC AGGACC C AGACAAT GT CAGC CT G CAAGAGGT GGAGG C AGAG GC C CT G 42 60 

Qy 4295 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4354 

I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 42 61 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4320 

Qy 4355 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4414 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4321 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4380 

Qy 4 415 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4474 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II 
Db 43 81 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4440 

Qy 4475 GAGAT T G GT GAT CTGCCCCCGCTGGTCCTGT C AC CT T C C CAGT AC C AC AACT AC AC C CAG 4534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 44 41 GAGAT T GGT GAT CTGCCCCCGCTGGTCCTGT C AC CT T C C CAGT AC C ACAACT ACAC C CAG 4500 

Qy 4535 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4501 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4560 

Qy 4 595 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4 654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4561 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4 62 0 

Qy 4655 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 4 621 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4 68 0 

Qy 4715 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 4774 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 



Db 


4681 


Qy 


4775 


Db 


4741 


Qy 


4835 


Db 


4801 


Qy 


4895 


Db 


4861 


Qy 


4955 


Db 


4921 


Qy 


5015 


Db 


4981 


Qy 


5075 


Db 


5041 


Qy 


5135 


Db 


5101 


Qy 


5195 


Db 


5161 


Qy 


5255 


Db 


5221 


Qy 


5315 


Db 


5281 


Qy 


5375 


Db 


5341 


Qy 


5435 


Db 


5401 


Qy 


5495 


Db 


5461 


Qy 


5555 


Db 


5521 



AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 474 0 

ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4 834 

| | | | I | I I I I I I I I I I I I I I I I I > I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4 800 

TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 4 8 94 

| | | | | | | I I I I I I I I M I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 48 60 

GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4954 

| | | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4 92 0 

TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 5014 

I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 
TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 4 98 0 

C CC CAGAT GC GGGT GGT CACAGGC GACAT CCT GAC CGACAT CAC CGGC CACAAT GT CT CT 5074 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I 

CC C CAGAT GC GGGT G GT C AC AGGC GAC AT CCT GAC C GACAT CAC C GG C CACAAT GT CT CT 5040 

GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5134 

| I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5100 

GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5194 

I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I II I I I I II I I I I I I I II I I I 
GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5160 

AAG AT CGCGGTGCG C AG G G C T G C C C AG GT T T T C T AC AAC AAC AAG G G C TAT CAC AG CAT G 5254 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 5220 

C C CAC CT AC C T CAACAGC C T C AAC AAC G C CAT CCTGCGTGC C AAC CT GC C C AAGAGC AAG 5314 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I 

CC C AC CT AC CT CAACAGC CT CAACAAC GC CAT CCTGCGTGC CAAC CT G C C C AAGAG CAAG 52 8 0 

G GC AAC C C GG C GG CT T AC GGC AT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC C AGC G C C 5374 

II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GG CAAC C C G GC GG CT T AC G G CAT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC CAGC G CC 5340 

AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 5434 

I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I II I I I I I 

AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 54 00 

GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 5494 

I I I | | | | | | I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 54 60 

AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 5554 

I I I I | | | | I I | I I II I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 552 0 



I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Qy 


5597 


Db 


5581 


Qy 


5657 


Db 


5641 


Qy 


5717 


Db 


5701 


Qy 


5777 


Db 


5761 


Qy 


5837 


Db 


5821 


Qy 


5897 


Db 


5881 


Qy 


5957 


Db 


5941 


Qy 


6017 


Db 


6001 


Qy 


6077 


Db 


6061 


Qy 


6137 


Db 


6121 


Qy 


6197 


Db 


6181 


Qy 


6257 


Db 


6241 


Qy 


6317 


Db 


6301 


Qy 


6377 


Db 


6361 



TGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCT 5656 

I I I I I I I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

TGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCT 564 0 

GCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCC 5716 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCC 570 0 

TCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTC 577 6 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTC 57 60 

AT C G GC AT C AC C GC CAC C GT GGCCAC CTT C CT GCTAC AGCT CTT C GAG CAC GAC AAGGAC 5836 
I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
AT C GGCAT CAC C GC C AC CGT G GC C AC CTT C CT GCTAC AGCT CT T C GAG CAC GACAAGGAC 5820 

CTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTG 58 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTG 58 8 0 

GGCCACGGGCT CAT GGAGATGGCCTACAACGAGTACATCAACGAGTACTACGCCAAGATT 5956 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GG C CAC G GG CT CAT GGAGAT G GC CT ACAAC GAGT ACAT CAAC GAG T AC T AC G C C AAGAT T 5940 

GGCCAGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTG 6016 

I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GG C C AGT TT GACAAGAT GAAGT C C C C GT T C GAGT GGGACAT T GT CAC C C G C GGAC T GGT G 6000 

GCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTC 6076 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I II I I I I 1 I I I I I I I I I I I I I 
GCCATGGCGGTTGAGGGCGTCGTGGGTTTCCTCCTGACCATCATGTGCCAGTACAACTTC 6060 

CTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTG 6136 

II I I I I II I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
CTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTG 6120 

GC CAGT GAG C G GCAGC GAGT GCT C C GGG GAGAC GCCGACAAT GAC AT G GT CAAGAT T GAG 6196 

I I I I I I II I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 

G C CAGT GAGC GG CAGC GAGT GCT C C GGG GAGAC GC C GACAAT GACAT GGT CAAGAT T GAG 618 0 

AACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTG 6256 

M I I I I II I I I II I I I I II I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
AACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTG 6240 

TGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAG 6316 

I I I I II I I I I I I I I I I I I I I I I I I II I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAG 6300 

ACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTC 6376 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

AC CAGCACCTT CAAGAT GCT GACCGGC GAC GAGAGCAC GAC GGGGGGCGAGGCCTT CGT C 63 60 

AATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCG 6436 

I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCG 642 0 



6437 CAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGG 64 96 

I M I I I I I I I I I I I II I I I I I I M I I I I I I I I I I I M I I I I I I I I I | | | | | | I M I I I I I 

6421 CAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGG 64 80 

64 97 CTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTG 6556 

I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I 
6481 CTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTG 6540 

6557 GAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAG 6616 

N M I I I I I I I I I I I I | I I I I I I I I I I I I | I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
6541 GAGCT GAC CAAGT ACGCAGAC AAGC CGGCT GGCACCTACAGCGGCGGCAAC AAGC GGAAG 6600 

6617 CTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACC 6676 

I I N I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | | | | | | | M 
6601 CTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACC 6660 

6677 ACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAG 6736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

6661 ACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAG 6720 

6737 ACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACG 6796 

I > I I I I I I I I I I I I I I | | | | | | | | | I | | | I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | 
6721 ACAGGGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACG 67 80 

6797 CGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAG 6856 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
6781 CGGCT GGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAG 6840 

6857 AACCGGTTTGGAGATGGCTACATGATCACGGTGCGGACCAAGAGCAGCCAGAGTGTGAAG 6916 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6841 AACCGGTTTGGAGATGGCTACATGATCACGGTGCGGACCAAGAGCAGCCAGAGTGTGAAG 6900 

6917 GACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCAC 6976 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I 

6901 GACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCAC 6960 

6977 ACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAG 7036 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6961 ACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAG 7020 

7037 ATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTG 7096 

I I I I I I I I I I I I I I I II I | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

7021 ATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTG 7080 

70 97 GACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCTGGAGCAGCAGGAGACG 7156 

I I I I I I I I I I I I I I I I I I I M M I I I I 

7081 GACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCTGGAGCAGCAGGAGACG 7140 

7157 GAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGG 7216 

I I I I I I I I I I I I I I I I I I I I I I I I I I I MINI 

7141 GAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGG 7200 

7217 TCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAG 727 6 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I | | 

72 01 TCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAG 7260 

7277 GACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACG 7336 



Db 



I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | M I I I I I I 

7261 GAC GAGGG C C T CAT C AG CT T C GAG GAGGAG C G G G C C C AG CT GT C CT T CAAC AC G GAC AC G 732 0 



Qy 7 337 CTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTG 73 96 

I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I || | | | | M II I I I I II 

Db 7321 CTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTG 73 80 

Qy 7397 GGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGA 7456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7381 GGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGA 7440 

Qy 7 457 GGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTC 7516 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II II I I I I 
Db 7441 GGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTC 7500 

Qy 7517 ACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCT 7576 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7501 ACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCT 7560 

Qy 7577 TGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTG 7636 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I II 
Db 7561 TGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTG 7620 

Qy 7 637 CTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCC 7696 

I I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I 

Db 7 621 CTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCC 7680 

Qy 7697 TCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGA 7756 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 681 TCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGA 774 0 

Qy 7757 GCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCT 7816 

I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I 

Db 7741 GCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCT 7800 

Qy 7 817 GCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGA 787 6 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | 
Db 7801 GCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGA 7 8 60 

Qy 7 877 ATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGC 7 936 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 7 8 61 ATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGC 792 0 

Qy 7 937 CATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGT 7996 

I II I I I I I I I I I I I I I I I I I I I I I Ill I I I I I I I I I I I I I 

Db 7 921 CATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGT 7 980 

Qy 7997 AC AT AGC GC AC AGAT GT T T GT T TT AAATAAAT AAACAAAAT GT C 8040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 7981 ACATAGC GCACAGAT GTT T GTTTTAAATAAAT AAACAAAAT GT C 8024 



RESULT 6 

US-10-380-727-28 

; Sequence 28, Application US/10380727 
; Publication No. US20040024183A1 
; GENERAL INFORMATION: 



APPLICANT: INCYTE GENOMICS, INC.; LEE, Ernestine A.; 
APPLICANT: YUE, Henry; LAL, Preeti G. ; 
APPLICANT: CHAWLA, Narinder K. ; BAUGHN, Marian R. ; 
APPLICANT: WARREN, Bridget A. ; LEE, Sally; 
APPLICANT: SANJANWALA, Madhu S.; YAO, Monique G. ; 
APPLICANT: RAMKUMAR, Jayalaxmi; THORNTON, Michael; 
APPLICANT: GANDHI, Ameena R. ; POLICKY, Jennifer L. ; 
APPLICANT: ELLIOTT, Vicki S.; ARVIZU, Chandra; 
APPLICANT: RAUMANN, Brigitte E . ; BRUNS, Christopher M. ; 
APPLICANT: NAINA, Amir; HAFALIA, April J. A.; 
APPLICANT: NGUYEN, Danniel B. ; XU, Yuming; 
APPLICANT: LU, Dyung Aina M. ; ISON, Craig H. ; 
APPLICANT: GRIFFIN, Jennifer A. ; REDDY, Roopa M. ; 
APPLICANT: BURFORD, Neil 

TITLE OF INVENTION: TRANSPORTERS AND ION CHANNELS 
FILE REFERENCE: PI-0217 USN 
CURRENT APPLICATION NUMBER: US/10/380, 727 
CURRENT FILING DATE: 2003-03-14 
PRIOR APPLICATION NUMBER: PCT/US01/2 8938 
PRIOR FILING DATE: 2001-09-14 
PRIOR APPLICATION NUMBER: US 60/241,700 
PRIOR FILING DATE: 2000-10-18 
PRIOR APPLICATION NUMBER: US 60/240,540 
PRIOR FILING DATE: 2000-10-13 
PRIOR APPLICATION NUMBER: US 60/239,057 
PRIOR FILING DATE: 2000-10-05 
PRIOR APPLICATION NUMBER: US 60/236,882 
PRIOR FILING DATE: 2000-09-29 
PRIOR APPLICATION NUMBER: US 60/234,842 
PRIOR FILING DATE: 2000-09-22 
PRIOR APPLICATION NUMBER: US 60/232,685 
PRIOR FILING DATE: 2000-09-15 
NUMBER OF SEQ ID NOS : 52 
SOFTWARE: PERL Program 
SEQ ID NO 28 
LENGTH: 7 610 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_feature 

OTHER INFORMATION: Incyte ID No. US20040024183A1 7078207CB1 
US-10-380-727-28 



Query Match 93.6%; Score 7529.2; DB 17; Length 7610; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 7531; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 
Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I N I I I I I I I I I I I I I I I I i | | | | M I I I I I I I I I I I I II I I I | | | | | | | | M I I I I I I I 

Db 77 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 136 

QY 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I M I I I I M I I I I I I I M II I I M II I I I I II I I I I I I I I I I II I I I I I I M I I I I I I I 

Db 137 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 196 



121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 180 
I I I I I I I I I I I I II I I I I I I I I I I | | I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 



197 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 256 



181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 240 

oc I 1 1 I I I I I I I I I I Ml I IN Hill llllll I I II || | MM Ml III III III 

257 CTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 316 
241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

IIIIIMMMMIIIIIIIIIIIIIIIIIIIIIIMIIIIIIIIIIIIM I I 

317 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 376 
301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

„ I' M I M II I I III I II II IN I MM || || in Ml II MM I II Mill MM 

377 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 436 
361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 

. I I I I I I I M M I I M I II I M I II I M II I I II I M | I I I I I I | | | | M 

437 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 496 
421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 480 

, IIIIMIMIMM M M I I I I I II M I II I I II I I I I I I MMMMI 

497 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 556 
481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 



illiiililiiiiiUL 1 1 1 1 I M Ml MM MM II II llllll I ; 

616 



557 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 



541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 



617 



I M I I I I I I I II I II I I I I II I II I I I II II I I I II I II II II I I I || 

CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 67 6 

601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 
1 I I I I I H I I II I M M II II I II I I II I I I I II Ml | M II I I II I I I I I I II I I || || 
GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 736 



677 
661 
737 
721 
797 
781 
857 



GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I I I I I I I N I I I I I I I I M I I II I I I I I II I II II II II I | | | 

GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 796 

GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 78 0 

I I I I I I I I I I I I N N M I M M M I M II II I II I II I II II II | | || | 

GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 856 

GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 840 

HUH M I M I I I I I I II I I II M I II II I II I | | 

GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 916 



841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 900 

I I I N II I I II I I I I I II II I I I II II I I I II II | || I II II I II I || || I II II 

CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 976 



917 
901 
977 
961 
1037 



CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I M II I I I I II II M II I II | || | | | | | || | M II I II I I II I I I II I 

CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 1036 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

I I I I I I I I I I I M I I I I I I M I I I M M II II I I I II I I II II II I II II I II I 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1096 



1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

[111MM MM I III III II II I IN M MINIM MM mi inn M 

CTGCCCCA 1156 



1097 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTAi 



1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

„„ 'j. J. 111 '''I I III I III Mill INI I III INN || inn | mi mi | |,|, in 

1157 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1216 

1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

1 1 1 1 1 1 I I I I I I M M I I II II I I | | || | M I I II I || I II II I || M I I I II II II I II 
1217 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1276 



1260 



1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 

' ' M I II I I II | | | I I II II I I I I I I I I I II I I I I I I II II I I II I I II I I II I 

1277 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1336 
1261 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 1320 



I I I I I I I II I I I I II II I I I I I I I I I I II I II I I II II I I II II II I I II I | | | I 
1337 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 



1396 
1380 



1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 

I 1 I I I I I I I I N I I I I I M I I I II I I I II II II I II I I I I I | I II I I I I I I I I I I I I I I I 

GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1456 



1397 
1381 
1457 
1441 
1517 
1501 
1577 
1561 



CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

IIIIIIIIIMIIIIIMIMMMMMIIIIIIMIIMI MIIMMIMM 

CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1516 
CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

' I I I I M I I II I I I II II | I I I II I II II I II I I I Mill | | M | I i I 

CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1576 
TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

11,1 I I I f I I I I I 1 I I I I II I I I I I I I I I I I M I I I I I I I I I I I I I M I I I I I I 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1636 



GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 
" " I I I I I I I I I I I I I M I I I II I I | I I I I I I I II I I II I I I I I I I I I 

C 1696 



1637 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGG 



1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 168 0 



1697 
1681 
1757 



" IM I' II I I I II II I I I I II I I I II M II II I I II M | I | | 

ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 175 6 
CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

HI" I f I I I I I I I I I I I I I I I I I I | | J MINIMUM 

CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1816 



1741 CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 



1817 
1801 
1877 



m ii ii ii 1 1 ii i M M i ii 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 mTi'm NTiTm 1800 

CCAGTTCATGTCCAAGGTGAGCGTGGACATCTTCAAGGGCTTCCCCGACGAGGAGAGCAT 1876 

TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 1860 
1 1 1 1 1 1 1 1 1 1 I N I I I I II II II II I II II II I I I II M | II II N I II II II II II II I 

TGTCAACTACACCCTCAACCAGGCCTACCAGGACAACGTCACTGTTTTTGCCAGTGTGAT 1936 



1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 

Nil I I I I M I I I I I I I I I I I I I I I I I I I | || | | | | | | || | | | | | || | | | | , | || 

1937 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1996 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | I I I I I 

1997 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 2056 



1981 
2057 



TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2 040 
11 I I I M I I I I I I I II I I II I II II I I II I I I I I I II I I I II I I || I I I I I I I II I I I I I 
TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2116 

2041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I I I I I I I I I I I I I I I I I I I II I I I I I II I II I I I I I I I I | | I I I I I I I I | | | | I 

CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2176 



2117 
2101 
2177 
2161 
2237 
2221 



GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

I I I I I I I I I I I I I I I I M II I I I I I I I || | I I I I I I I I I I I I I I I I I I I I I I 

GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2236 

GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

1 1 1 I 1 I I I II I I I I M I I II I I I I I I II I I I II I I II I II I I I II I I II I I I M 

GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2296 

GGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCA 2280 

' 1 1 <■ I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I f | M I I I I 1 I I I I I ( I I I I I I I I I I I I 

2297 GGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCA 2356 



22 81 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 
' ' I M I I I II I I I I I I I I I I M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 



2340 



2357 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2416 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 24 00 

I I I I I I I I I I M I I I I I I I I I | | | I I I I I I I II I I I I I I I I I I I I I I M 

2417 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2476 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

H I I I I I I I I I I I I I I I I | | | | | | || |,| 

2477 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2536 

2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

„ " I II I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2537 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2596 

2521 CATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTG 258 0 



liiililliiliiil I I M I I I I I I I I I I I I I I I I I I I II I II 



2597 CATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTG 



2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2640 

„ B I I I I M I I I I I I I I I | | | | | I I I I I I I I I | | I I I I I I I I II I I I I I I I I 

2657 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2716 

264 1 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 27 00 



1 1 1 1 1 I I I I I I I I I I I I I I I I I I I | | | | | | I I I I I I II I I I I I I | | | | | | | I I I I I I I I I 

GGGGA 2776 



2717 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAG 1 



2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 



2777 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 283 6 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2 820 

I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

2837 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2896 

2821 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2880 

I M I I I I I I I I I I I || I I I | | | | | | | | | | | | | | | M | | | | | | | | | || | || | | | | | 

28 97 CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 2 956 

2881 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I 

2957 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 3016 

2941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M | I I I I I I I I I I I I I I I I I I I I I I 
3017 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 307 6 

30 01 GGTTGTCTGCGTG GACAAACT C AC CAAGGT C TACAAGGAC GACAAGAAGCT G GC C C T GAA 3060 

II I I I I M I II I III I I I I I II II I II | | | | 

3077 GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3136 

30 61 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

I M I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I | | | | | | | | | I I I I I I I I I I I II I I 
3137 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3196 

3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3180 

I I I I II II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3197 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 3256 

3181 CAC CAT CTAC GGGCAC GACAT C CGCACGGAGAT GGAT GAGAT CCGCAAGAACCT GGGCAT 3240 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | I I I I I I 1 I I 
3257 CACCAT CTACGGGCAC GACAT CCGCACGGAGATGGATGAGAT CCGCAAGAACCT GGGCAT 3316 

3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I M I I I I I II I I I I I I I I I I I I I I I I I I I I | I I II I I I I 

3317 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 337 6 

3301 CT C AC GGCT CAAGAGCAT G GCT CAGGAGGAG AT C C G CAGAGAGAT GGACAAGAT GAT C GA 3360 

I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I 1 1 I I I I | | | | | | | | | | | | | | | | | | 

3377 CT C AC GG CT CAAGAGCAT GGCT C AGGAG GAGAT C C GCAGAGAGAT GGACAAGAT GAT C GA 3436 
3361 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3420 

I M M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | M I I I I I I I I I I I I 

3437 GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 3496 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 80 

M I I I I I I I I I I I || | | | | | | | | | | | | | | | | | | | | | || | || | | | || | | | | | | | | | 

3497 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3556 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 354 0 

I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3557 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 3 616 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3 600 
I I I I I I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 



Db 3617 C AAG C C AG G C C G C AC CAT CCTTCTGTC C AC C C AC C AC AT G GAT GAG GCT G AC CTGCTTGG 3676 

Qy 3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I II I I I I I M I I | I I | I I I 
Db 3677 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3736 

Qy 3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3737 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 3796 

Qy 3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 378 0 

I I I I I I I I I I I I I I I I I I II I I I I I I II I M I I I I I I II I I I I I I I I I I I I II I I I I I I I 

Db 3797 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3856 

Qy 37 81 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3857 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3916 

Qy 3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I I I I I I I I I I I I II I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3917 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3976 

Qy 3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
Db 397 7 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 4 036 

Qy 3961 GCT GAT GGACACGACC CT GGAGGAAGT GTT C CT CAAGGT GT CGGAGGAGGATCAGT CGCT 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 4037 GCT GAT G GACAC GACC CT GGAGGAAGT GT T C CT CAAGGT GT CG GAGGAG GAT C AGT CGCT 4096 

Qy 4 021 G GAGAACAGT GAG GCC GAT GT GAAGGAGT C C AG GAAG GAT GT GCT CCCTGGGGCG GAGG G 408 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4097 GGAGAACAGT GAGG CC GAT GT GAAGGAGT CCAGGAAGGATGTGCTCCCTGGGGCGGAGGG 4156 

Qy 4 081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 
Db 4157 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 4216 

Qy 4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4200 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4217 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 4276 

Qy 42 01 C T AC AC C G AC GT C TAT G G C G AC T AC CGCCCCCTCTTT G AT AAC C C AC AG GAC C C AGAC AA 4260 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 4277 C T ACAC C GAC GT C TAT GG C GAC T AC CGCCCCCTCTTT GAT AAC C CACAG GAC C C AGAC AA 4336 

Qy 4261 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 4337 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4396 

Qy 4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4397 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 4456 

Qy 4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4440 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 4457 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 4516 



Qy 4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4517 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4576 

Qy 4501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4577 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4636 

Qy 4561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I II 
Db 4 637 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4696 

Qy 4 621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I 
Db 4 697 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4756 

Qy 4 681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 4757 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 4816 

Qy 4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 48 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4817 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4876 

Qy 4 8 01 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4 8 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 4 877 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCT 4936 

Qy 4 8 61 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4920 

I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 937 GCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACC 4 996 

Qy 4 921 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 498 0 

I I I II I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 997 CTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGG 505 6 

Qy 4981 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5040 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I 
Db 5057 CTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGA 5116 

Qy 5041 CATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCG 5100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 5117 CAT C CT GAC C GACAT C AC C GGC C AC AAT GT CT CT GAGT AC C T GC T CT T C AC CT C C GAC C G 5176 

Qy 5101 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5160 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 5177 CTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGC 5236 

Qy 5161 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52 37 CTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCA 5296 

Qy 5221 GGTTTTCTACAACAACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAA 5280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 52 97 G GT T T T C T AC AAC AAC AAG G GCT AT C AC AG CAT G C C C AC C T AC CT C AAC AG C CT C AAC AA 5356 



Qy 5281 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5340 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 5357 CGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCAC 5416 

Qy 5341 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 5400 

I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I 
Db 5417 CGTCACCAACCACCCCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCA 547 6 

Qy 5401 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 77 GGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAG 5536 

Qy 54 61 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 552 0 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I 
Db 5537 CTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAG 5596 

Qy 5521 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5580 

I I I I I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5597 CGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCT 5656 

Qy 5581 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5640 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I 
Db 5657 GGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTC 5716 

Qy 5641 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5700 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 5717 GCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCC 5776 

Qy 5701 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5760 

I I I I I II I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5777 CATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCAT 5836 

Qy 5761 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5820 

M I I M II I I I I I I I I I I I I I I I II I I I I I I I I I I I 1 1 I I I I I I I I I | | | | | | | | | | | | | 

Db 5837 TGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTT 5896 

Qy 5821 CGAG CAC GACAAGGAC CT GAAGGT T GT CAAC AGT T AC CT GAAAAGCT G CT T C CT C AT T T T 5880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 58 97 C GAG CAC GACAAG GAC CT GAAG GT TGT CAAC AGT T ACCT GAAAAG CT G CT T C CT CAT T T T 5956 

Qy 5881 C C CCAACT ACAAC CT GG GC CAC GGGCT C AT GGAGAT GGC CT ACAAC GAGT AC AT CAAC GA 594 0 

I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5957 C C C CAAC T AC AAC CT G G G C CAC GGGCT CAT G GAGAT GGC CT AC AAC GAGT AC AT CAAC GA 6016 

Qy 5941 GTACTACGCCAAGATTGGCCAGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGT 6000 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 6017 GT AC T AC G C CAAGAT T GG C CAGT T T GACAAGAT GAAGT CCCCGTTC GAGT GG GAC AT T GT 607 6 

Qy 6001 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6077 CACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCAT 6136 

Qy 6061 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 6137 GTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGA 6196 

Qy 6121 GGAT GAT GT GGAC GT G GC CAGT GAGC GG C AGC GAGT GCT CC G G G GAGAC G C C GAC AAT G A 6180 



Db 


6197 


G GAT GAT GT GG AC GT GG C C AGT GAG C G G C AG C GAGT G C T C C G GG GAG AC G C C GAC AAT G A 


6256 


Qy 


6181 


CAT G G T C AAG AT T G AGAAC C T GAC C AAG GT CT AC AAGT C C C G GAAGAT T G G C C GT AT C C T 


6240 






i i i i i i i i i i i i i i i i i i i i i i i i i i i i I i i i i i i i i i i i i i i t i i i i i i i i i i i i i i t i 
1 M I I 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 II 1 1 1 1 1 II 1 II 1 II II II M 1 1 II 1 M 1 II II 1 1 1 II 




Db 


6257 


CAT GGT CAAGATT G AGAAC CT GACCAAGGT CTACAAGT CC CGGAAGATT GGCC GTAT CCT 


6316 


Qy 


6241 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 


6300 




1 1 l 1 1 1 1 1 l 1 1 1 1 1 1 L 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
| | | | | | I | I | | | | | | | | | | | I 1 1 1 1 1 II 1 1 I 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6317 


GGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGT 


6376 


Qy 


6301 


C AAC GGT GC GG G C AAGAC C AGC AC CT T C AAG AT G CT GAC C G G C GAC GAGAG C AC GAC G G G 


6360 




■ i i i i i i < i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i < i i i i i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6377 


CAAC G GT GC GG GCAAGAC CAG CAC CT T CAAGAT G CT GAC C G GC GAC GAGAGC ACG AC GGG 


6436 


Qy 


6361 


GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 


6420 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6437 


GGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAG 


6496 


Qy 


6421 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 


6480 




i i i i i i i i i i i i i » i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

1 II I 1 I 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6497 


CCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCT 


6556 


Qy 


6481 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 


6540 




II 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 M M 1 1 II 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6557 


GCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTG 


6616 


Qy 


6541 


GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 


6600 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i i i i i i i i > i i i i i i i i i i i i i i i i i i i i i i 
I I 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6617 


GGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGG 


6676 


Qy 


6601 


CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 


6660 




.... , i ■ i i i i i ■ ■ i i ■ i ■ i i i i ■ i i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i 

1 1 1 1 1 1 1 M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6677 


CGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTT 


6736 


Qy 


6661 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


6720 




i i i t i i i i i i i i i i r i i i i < i I I I i I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 I I I II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 




Db 


6737 


CCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCAT 


6796 


Qy 


6721 


C CT C GAC CT CAT C AAGAC AG G G C GT T C AGT G GT GCT GAC AT CAC AC AGC AT G GAG GAGT G 


6780 




■ i i i i i i i i i i i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i t i 
I | I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 




Db 


6797 


C CT C GAC CT CAT C AAGAC AGGGC GT T C AGT GGT G CT GACAT CAC AC AG C AT GGAG GAGT G 


6856 


Qy 


6781 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6840 




i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i \ i i 

1 1 M 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 




Db 


6857 


CGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAG 


6916 


Qy 


6841 


CAT C C AGC AC C T GAAGAAC C G GT TTG GAGAT GGC T ACAT GAT CAC GGT G C GGAC CAAGAG 


6900 




i i i i i i i i i i \ i i i i i i i t i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 




Db 


6917 


CAT CC AGCACCTGAAGAAC CGGTTT GGAGAT GGCTACATGAT CACGGT GCGGAC CAAGAG 


6976 


Qy 


6901 


CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


6960 


Db 


6977 


1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 M 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 
CAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCT 


7036 


Qy 


6961 


CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 


7020 



I II 1 1 1 1 1 1 II II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 



Db 



7 037 CAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGC 7096 



Qy 


7021 


Db 


7097 


Qy 


7081 


Db 


7157 


Qy 


7141 


Db 


7217 


Qy 


7201 


Db 


7277 


Qy 


7261 


Db 


7337 


Qy 


7321 


Db 


7397 


Qy 


7381 


Db 


7457 


Qy 


7441 


Db 


7517 


Qy 


7501 


Db 


7577 



CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 708 0 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGT 7156 

CAGCCAGACCACACTGGACT^lTGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCT 7140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I II I I I I I I I 
CAGCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAACCT 7216 

GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 7200 

1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

GGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAG 727 6 

CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 7260 

I | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I 
CCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGA 733 6 

GGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTC 732 0 

I I I II I I I I I I M I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GGAC CT GGAC AC G GAG G AC GAG G G C C T CAT C AGCT T C GAG GAGG AGC GG GC C CAG CT GT C 7396 

CTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCAC 738 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

CT T CAAC AC G GAC ACGC T C T GC T GAC C AC C C AGAG C T GGGC C AGG GAG G AC AC G CT C C AC 7456 

TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 744 0 
I I I I I I I I II I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
TGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGC 7516 

CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 7500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I 
CAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCG 757 6 

GCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCT 7534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
GCCATGTCCTGCGGTCACTGCGGTTGCCGGCCCT 7 610 
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Query Match 90.8%; Score 7301.8; DB 9; Length 7305; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 7303; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 35 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 94 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 1 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 60 

Qy 95 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 120 

Qy 155 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCG 214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 121 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCG 18 0 

Qy 215 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 24 0 

Qy 275 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 300 

Qy 335 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 394 

I I I I I I I I I I I I I I I 1 I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 360 

Qy 395 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 454 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 42 0 

Qy 455 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 421 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 48 0 

Qy 515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I 
Db 481 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 54 0 

Qy 575 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 634 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I 
Db 541 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 600 

Qy 635 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 694 

I I I I I I I I I I II I I I I II II I I I I II I I I I I I I I II I I I I I II I II I I I I I I I I I I I I I I 
Db 601 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 660 

Qy 695 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 754 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 720 

Qy 755 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 



721 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 78 0 

815 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 874 

I I M | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
781 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 84 0 

875 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCC7^AGGTCTCCCAGCAGCTG 934 

M I I I I | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 900 

935 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 994 

I I I I I I I I I I I I I I I I I I I I I I I I I i I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
901 GGCCTGGATGCCCCCAACGGCTCGGACTCCT CGCCACAGGCGCCACCCCCACGGAGGCTG 960 

995 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

961 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1020 
1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 

1021 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 108 0 

1115 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1174 

| | I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1140 

1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1234 

I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I 
1141 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1200 

1235 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 12 94 

| | I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 12 60 

12 95 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

I I I I I I II I I I I I I II I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1320 

1355 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAA7\ATC 1414 

| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 AGCAAG GAGC AGC GGAAC CTGGGCCTC CT CGT G CACC T CAT GACCAGCAAC C C CAAAAT C 1380 

1415 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1474 

I I M | I I I I I I I I I I I I I I I I I I I I II I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I I 
1381 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1440 

1475 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

I M I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
1441 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1500 

1535 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGC7^ACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I II I I I I 
1501 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1560 

1595 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
1561 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 162 0 



1655 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

| | | | | | | | | | | | | | | I I I I I I I I I II I I I I I I I I I I I M I I I I I I I II I I I M I I I I I I I 
1621 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1680 

1715 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 1774 

I | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I 

1681 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 1740 

1775 AAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGAC 1834 

| | | | I | I I I I I I I I I I I I I I I II I I I I I I I I I I 

1741 AAGGGCTT CCCCGACGAGGAGAGCATT GTCAACTACACCCTCAACCAGGCCTACCAGGAC 1800 

1835 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 1894 

| | | | | | | | | I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 60 

1895 CACGTGCACTACAAGATCCGCCAGAACTCCAGCTTCACCGAGAAAACCAACGAGATCCGC 1954 

| | | M | | I | I I I I I I I I II I I I I I I I I I M I I II I I I I I I I I I I I 

1861 CAC GT GC ACTAC AAGAT CCGCCAGAACT CCAGCTT CACC GAGAAAACCAACGAGATCC GC 1920 

1955 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2014 

| | | | | | I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 1980 

2015 GTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTG 2074 
| II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I Mill 

1981 GTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTG 2 040 

2075 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2134 

| M I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I M I I I II I I I I I I I I I I I I M I I 
2041 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2100 

2135 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2194 

| | | I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

2101 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2160 

2195 GCCATGACCATCCAGCACATCGTGGCGGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAG 2254 

| | | | | | || | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I Ml 

2161 GCCATGACCATCCAGCACATCGTGGCGGAGAAGGAGCACCGGCTCAAGGAGGTGATGAAG 2220 

2255 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

| | | || || | || || II II II II II II I I I I II II I M I I I I M I M I I II II M M 

2221 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2280 

2315 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2374 

| | | | | | | | || | II II II II II II II M II I I I I II I I M I I I II I II II M I M II Ml 

2281 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATACAC 2340 
2375 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2434 

I | | M | || I I II I I II I I I II II I I I II I I I M II I M II I I Mill 

2341 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2400 

2435 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2494 

|| | || | | M I II I M I M II II II II I II I II M I I I I M I M II II II II I I 

2401 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2460 



2495 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 

MMI | | | | | | | | | I I M I II I II I I I M I M I I I I I I I I I I I I I I 

2461 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 

2555 GATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGT 

| | | | M I I I I I I I I I I I I I I I I I M I II II I M II I I I II I I I I I 

2521 GATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGT 

2615 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 

| | | | | | | II I I I I I M I II II I I I I I I I I I I I I I 

2581 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 



2554 
2520 
2614 
2580 
2674 
2640 



2675 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2734 

II I I I I MM II II Mill Mill I III I III II MM I 

2 641 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2700 



2735 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 27 94 

M | || | || II M II I M I I II I I M I I I M I II I I II I I II I I I 1 ' 

2701 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 



2760 



2795 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2854 

| | | | | | | | II II II I II I II I M I I M M I M I I M I 

2761 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2820 



2855 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2914 

| | | | II I I I II II II I M I I II I II I I I M I I I I I I I I I I M I II I I I 

2821 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 



2880 



2915 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 2974 

| | | II I I I M I II II M M I M I I I I I I M II I I M 

ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 



2881 



2940 



2975 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3034 

| I II I I I II II I II II II I I II I I I I I I I I I I I I I I M I II M I 

2941 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 



3000 
3094 



3035 AAGGACGACAAGAAGCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTG 

MM M I II II II M M I M I I M I M II II I I I I M II M I 

3001 AAGGACGACAAGAAGCTGGCCCTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTG 3060 



3095 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAA.GACCACCACCATGTCCATCCTGACCGGC 

|| || II II M I I I M I M II I M I II I I II I I I I I I I M I M M I I II I I I I I M I I I M 
3061 GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 



3154 
3120 



3155 CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 3214 

| || I II I M II II I I I I I II I II I I I I I M II I II I I M II II I M I I I 

CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 



3121 



3180 



3215 GATGAGATCCGCAA.GAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 3274 

|| I I II I I II I II M II I M II M I I M M I I I I M II I M I M II II II I II I I M M I 
GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 



3181 



3240 



3275 ACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGAGATC 3334 

| | | || II I II I II M M M M M II I II II II M M M I M I M II I I II I M I M M I I 
3241 ACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGAGATC 



3300 



3335 C GCAGAGAGAT GGACAAGAT GAT CGAGGACCT GGAGCT CT CC AACAAACGGCACT CACT G 3394 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

3301 CGCAGAGAGATGGACAAGATGATCGAGGACCTGGAGCTCTCCAACAAACGGCACTCACTG 

3395 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 

| | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3361 GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 

3455 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 

I I I I I I I I I I II I I I I I I I I I II I I I M II I I I I I II 1 1 I I I I I I I I I II I I I I I I I I I I 

3421 GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 

3515 GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCAC 

| | | | | | | II I I I I I I I I I I I I I I I I I I I I I 

3481 GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCAC 3540 

3575 CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTC 3634 

|| | | | | | | | || I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3541 CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTC 3600 

3635 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 3694 

M I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I II 

3601 AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 



3360 
3454 
3420 
3514 
3480 
3574 



3695 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 
| | | | | | | | M | | | | I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I 
3661 CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 

3755 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 

| M | I II I I I II I I I I I I II I I I I I I I I I I II I I I I I I I I II I I I I I I 

3721 CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 

3815 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 

I I I II I I II I II I I I I I I I I MM I I II I II I I I I I I I I I I II I I 

3781 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 

3875 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 

| | | II I I II II I III I I I I I I I I I I III I I I I I I I I III I I I II I I M I I I I I I I 

3841 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 



3660 
3754 
3720 
3814 
3780 
3874 
3840 
3934 
3900 



3935 GATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTC 3994 

| I I M I I I I I I I I II I I I I I I I I I II I I I I I I I I I I II I I >l 

3901 GATGCACTGCACCTCAGCAGCTTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTC 



3960 



3995 AAGGTGTCGGAGGAGGATCAGTCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGG 4054 

|| | | M I I I II I III I I I I I II I I I I I I M I I Ml I Ml I M I I II I I I M I I I 

3961 AAGGTGTCGGAGGAGGATCAGTCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGG 



4055 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 

| | | | | | | | | | II I II I I I I I II I I I I I II I II I I M I I I I I I I I I I M II I I I I I 

4021 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 

4115 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 

M | | I M I II I I I II I I II I II I I I I I M I II I I I I I I II I I II I I 

4081 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 



4020 
4114 
4080 
4174 
4140 



4175 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4234 
M | I I II I I I I I I I I I I I I M I I I I I I M I I I I I I I I M I I I I I I I I M I I I I I I II I II 



4141 
4235 



TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 



T TT GAT AAC C C AC AGGAC C CAGAC AAT GT C AG C CT G CAAGAGGT GGAGG C AGAG GC C CT G 

I I I I | | I I I I | M | I I I I I M I II I I I I I I I I I I M I M I I I I I M I I I I II I I I I I I I I 

4201 T T T GAT AAC C C AC AG GAC C CAGAC AAT GT C AG C C T GCAAGAGGT GGAG G C AGAGGC C CT G 



4295 
4261 
4355 
4321 
4415 
4381 
4475 



TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 

| | | | | | | | M | | | M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 

TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 

CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 

| | | | | | | | | | | | I I I I II I I I I I I I I I I I I I I I II I M I I M I I I I I I I I I I I I I 

CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 

CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 

MINIMI I I I I I 1 I I I I I I M I I 1 M I I I I I I I M I t I I I I I 

CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 



GAGAT T GGT GAT CTGCCCCCGCTGGT C CT GT C AC CT T C C CAGT AC C ACAACT AC AC C C AG 

M | I I II II M I I I I I M M I I I I I I I M M I I MINIM 

4441 GAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAG 
4535 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 

I I I I I | I | | I II M I I II I II 11 M II I 11 I I M II 1 I I II I I I I I 1 I I I I 

4501 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 

4595 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 

| | | 1 1 | | | | | | | 1 t t I I I I I I I 1 I 1 1 I t I I I I I I 1 I I 1 I I I 1 I I I I I I I I I I I I 1 ■ I 1 I > 
4561 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 

4 655 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 

I I I II II I N II II II II I N II I I II I I I I I I I I I II II II N I II I II I N I I I I I II 

4 621 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 
4715 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 

I I M II I II II I II II II I N II I I I II I I I I I I I I N II II N I I I I I I I I I 

4 681 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 
4775 ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 

I l 1 | | 1 I 1 Ill Ml II III MM Mill INNNINI 

4741 ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 
4 835 TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 

I || I I M II N I II 1 I I N II II II I II I I I I I I I I N II I I I I M I I I I II 1 I II N I I 

4 801 TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 

4895 GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 
| | N II II I II I II I I II I II I I I I I II I I I N II I I I I II I I II I I II I I I II I I II I I 
4861 GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 

4955 TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 

I I I I I | | M I II I I II II I II II I I I I II M I M 1 1 I II I I II M I II I I II M II I I I I 

4921 TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 



5015 C C C C AGAT GCGGGTGGT C AC AG G C GAC AT C C T GAC C GAC AT C AC C G G C C AC AAT GT C T C T 

I I I I I N I I N II II II I I II I I I II II I I I I II M I N II I I I I I II II I I II I II N I 

4981 CCCCAGAT GCGGGTGGT CACAGGCGACATCCTGACCGACATCACCGGCCACAATGTCTCT 



4200 
4294 
4260 
4354 
4320 
4414 
4380 
4474 
4440 
4534 
4500 
4594 
4560 
4654 
4620 
4714 
4680 
4774 
4740 
4834 
4800 
4894 
4860 
4954 
4920 
5014 
4980 
5074 
5040 



5075 GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5134 

Ml MINIMI II MM Ml II I IN II MM Ml 1111 11111 '11 , inn 

5041 GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5100 



5135 GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 

I I M | | | M I M I II I I I I M I I I I I I I I M I M IMIIIIMII I 

5101 GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 
5195 AAGATCGCGGT GCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCAT G 

I I M I I I I M I I I I 1 1 I I I I 1 I I I 1 I I I 1 M I I I I HIM 

5161 AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 
525 5 CCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAG 

I M M I I M M I I M II I I I I I M I II I II II I II II I I I M I Ml 

5221 CCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAG 
5315 GGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCC 

M II I I I I I II I II I M II M III II M II I M I II I M II I I II I M I II I II M I I II 

5281 GGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCC 
5375 AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 

M M I I M I I I M I I I I I I I I M M I M M I I I I M I M M M I IIIIIIMIII 

5341 AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 

5435 GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 
M | M I I I II I I I I M I I I I I II I II I I I M I M I III M I II I II I I II II I I 

5401 GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 
5495 AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 

I M I I M I I I M I M M I I M I M M II M I I M I I 1 1 I I 1 1 M I I I I I M I 1 1 M I I I I 

5461 AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 

5555 TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 

| | | | | | M M I M I II M I I I M I I M II I I I I M I MM I 

5521 TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 

5615 GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 

M | | | | M I I I I I I I M M II II I M I I II II II I Ml I I M II I I I I M II I I I I M I I 

5581 GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 
5675 CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 

M | m I M I I I I I M I I M M I I I I I I II I M I I I Ml I I I M I M I I I M I I M I I M I 

5641 CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 
5735 CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 

II | | 1 1 | M I I I I 1 1 1 I 1 1 M 1 1 M I 1 1 I I II I II 1 1 1 I I I M II I M I I I M I II 1 1 I I 

5701 CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 



57 95 GTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGT 

|| | || | || | || | M II II M I M M I M I I I I I II I M II M M I I M M M M I I M I I 
5761 GTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGT 



5194 
5160 
5254 
5220 
5314 
5280 
5374 
5340 
5434 
5400 
5494 
5460 
5554 
5520 
5614 
5580 
5674 
5640 
5734 
5700 
5794 
5760 
5854 
5820 



5855 TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 5914 

M II I M II I M M II I II M M I I M M II I I I I I I I M I M M M I M I II I I M M I 
5821 TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 5880 



5915 AT GGCCT ACAACGAGTACAT CAACGAGTACTACGCCAAGATT GGCCAGTTT GACAAGAT G 

, | | | M | | | I I I I I I I 1 ! I I I I M I I M I I I I II I I I I I I I I I I I I I I I I I I 

5881 ATGGCCTACAACGAGTACATCAACGAGTACTACGCCAAGATTGGCCAGTTTGACAAGATG 

5975 AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 
M | I I | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I M I II I I I I I I I I I I M I I I I I I I 
5941 AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 

6035 GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 
| | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I M I I I I M I I I I I I I I I I I 
GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 



6001 
6095 
6061 



ATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGA 

| | | | | | | | | | | | | | I II I I I I I II I I I I I I I I I I I I I I Ml I 

ATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGA 



5974 
5940 
6034 
6000 
6094 
6060 
6154 
6120 



6155 GTGCTCCGGGGAGACGCCGACAATGACATGGTCAAGATTGAGAACCTGACCAAGGTCTAC 6214 

| | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

6121 GTGCTCCGGGGAGACGCCGACAATGACATGGTCAAGATTGAGAACCTGACCAAGGTCTAC 



6215 AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 
| | M | I I I I I I I I I I I I I I 1 I I I I M I I M I I I II II I I I I I I I I I I I I I I I I I I I I I I I 
6181 AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 

62 7 5 GGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATG 

M | I I I Mill I I I M II II II II M I M I II II I 

6241 GGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATG 

6335 CTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTG 

Mill MM I I II I MM MM MM MM II IMM MUM 

6301 CTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTG 63 60 
6395 AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 6454 

M M II Ml I II II I II I I I II I I M M MM II 

6361 AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 6420 



6180 
6274 
6240 
6334 
6300 
6394 



6455 GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 

I | m II M M I I I M II II II I I II I II II I II II II M M I I M M M 

6421 GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 

6515 AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 

M || II II I I II I I I II II II II I II II M I I II I I M M M II M I II I II I I I 

6481 AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 



6514 
6480 
6574 
6540 



6575 GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6634 

|| II I II I II II II M II I M M I II I M I I I II II M I II II 

GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 



6541 



6600 



6635 CT CATT GGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCAT GGACCCCAAG 6694 

| || || II II I II I I I I I I M I I I II II II M I I I I I M M I M I M I II I I II II I M II 
CTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAG 



6601 



6660 



6695 GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 6754 

| | | M II II I I II M II I II I I II II I II II I II 1 1 1 I II M I II MIMMIII 

6661 GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 



6720 



6755 CTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTG 6814 



Db 


6721 


I I I 1 1 1 I I I | | M 1 1 1 M M 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 M M M 1 1 II 1 1 1 1 1 1 M M 

/Nnm^^/-«T\^Tvr'rt7vrTirT , 7\ r* r a r* t p p P A P P P P P T P TP P A P (ZC PPPT nnp P AT C AT GGT G 
CTGACATCACACAGCATGGAGGAOl bOOAOOb-oo i bj j. bLAUb^b^u i bb'o^M.i x 


6780 


Qy 


6815 


AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 

| | | | | | | | | | | | | | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 I 1 II 1 1 1 1 1 I 1 1 

— -» ,^^^rn,^^/^,^m,^^/^^m^r , pmr'r , r < r< n ppzitpp a pp z\ pptp A Af^l A APPPriTTTf^GAGATGGC 
AACGGTCGCCTGCGGTGCO I GGOCAbjCAl ooaooao<^i LjA/vj/v\^v^*a^j i 1 i ijo.rvjj~i.-i. vj^^ 


6874 


Db 


6781 


6840 


Qy 


6875 


T ACATGAT CACGGT GCGGAC CAAGAGCAGCCAGAGT GT GAAGGACGT GGT GCGGTT CT T C 

| | | | | | | | M | | | I 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 i 1 1 1 I M 

TACATGAT CACGGTGCGGACCAAGAbCAbCCA<jA(a lb 1 (jAAotjAoij i <j<j i <o^<jvj x j. ^ j- j- 


6934 


Db 


6841 


6900 


Qy 


6935 


AACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAG 

| M | | | | I I M 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 I I I I I 1 1 1 1 1 1 1 1 

AACCGCAACTTCCCGGAAGCCATGC1 CMbbAbLbblAtL/ibAt/w\bb i bonu i n^unu 


6994 


Db 


6901 


6960 


Qy 


6995 


CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 

I | || | | | I I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 

CTCAAGTCGGAGCACATCTCGC 1 GGCCCACiijl bl l ^AtjCAA^/\i ij^b^Abuioi^io^ 


7054 


Db 


6961 


7020 


Qy 


7055 


GT GCT G GG CAT C GAGGACT ACT C GGT CAGCC AGAC CAC ACT GGACAAT GT GTT C GT GAAC 
| | | | | | 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 

„^^,^, m ^^^.^.-A m^«i\/i/^T\ r->m 7\ r+m r* r* rrn /-* 7\ rPP TS. H TS. PP 7\ P TS. PTfC AP A ATPTf^TTPf^TG AAC 

GTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACAC 1 bbAbAAibibi i tbibrtA^ 


7114 


Db 


7021 


7080 


Qy 


7115 


TTTGCCAAGAAGCAGAGTGACAACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTG 
| I II 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 

, ~, -r. r>7irimr<T\pA 7\ prmrT 7k PP APP2XPPZ1P APPPAflPPPPP ATPCGCACTG 

T T T G C C AAGAAGC AG AG T G AC AAC CIO C ACj C Abj bAb ijAb/\u (jj-vj l^o^ ^/-v i ^ rtV ^ x ° 


7174 


Db 


7081 


7140 


Qy 


7175 


CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 
| I I I I I 1 1 1 1 1 1 II II 1 II II 1 1 1 1 1 1 1 1 

CAGTCCCCTCTCGGCTGCl 1 GO 1 LAbLL 1 bbl bbbbLLbbbbl vj^^^^w^>vjvj.riAJ^ j. ^ 


7234 


Db 


7141 


7200 


Qy 

Db 


7235 
7201 


CGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGC 

MM 1 1 1 1 1 1 1 1 1 II 1 1 II 1 M 1 1 1 1 1 II 1 II II 1 1 1 

CGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGC 


7294 
7260 


Qy 


7295 


TTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTC 7339 

| | | | | | | I || II 1 II II 1 II 1 II II II II 1 1 1 1 II M II M II M 
T T C GAGGAGGAGC GG GC CC AGC T GT C CT T CAAC AC GGAC AC GCT C 7305 




Db 


7261 





RESULT 8 
US-10-156-239-9 

; Sequence 9, Application US/10156239 
; Publication No. US20030036074A1 
; GENERAL INFORMATION: 
; APPLICANT: Glucksmann, Maria A. 

APPLICANT: Kapeller-Libermann, Rosana 
; TITLE OF INVENTION: No. US20030036074Alel Nucleic Acid Sequences Encoding 
Human Transporters, A Human 

; TITLE OF INVENTION: ATPase Molecule, A Human Ubiquitin Hydrolase-Like 
Molecule, A Human 

; TITLE OF INVENTION: Ubiquitin Conjugating Enzyme-Like Molecule, and Uses 
Therefor 

; FILE REFERENCE: 35800/247645 

; CURRENT APPLICATION NUMBER: US/10/156, 239 

; CURRENT FILING DATE: 2002-05-24 

; PRIOR APPLICATION NUMBER: 09/795,693 



PRIOR FILING DATE: 2001-02-28 
; PRIOR APPLICATION NUMBER: 60/185,906 
; PRIOR FILING DATE: 2000-02-29 
; PRIOR APPLICATION NUMBER: 09/809,557 
; PRIOR FILING DATE: 2001-03-15 
; PRIOR APPLICATION NUMBER: 60/192,018 
; PRIOR FILING DATE: 2000-03-24 
; PRIOR APPLICATION NUMBER: 09/808,568 
; PRIOR FILING DATE: 2001-03-14 
; PRIOR APPLICATION NUMBER: 60/191,790 
; PRIOR FILING DATE: 2000-03-24 
; PRIOR APPLICATION NUMBER: 09/808,767 
; PRIOR FILING DATE: 2001-03-15 
; PRIOR APPLICATION NUMBER: 60/191,781 

PRIOR FILING DATE: 2000-03-24 
; NUMBER OF SEQ ID NOS : 60 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 9 

LENGTH: 7305 
; TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-156-239-9 

Query Match 90.8%; Score 7301.8; DB 15; Length 7305; 

Best Local Similarity 100.0%; Preci. No. 0; 

Matches 7303; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

35 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I 

1 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 60 

95 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

61 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 120 

155 GG GC T GC GAC AGAAG AAG C C CAC CAT CT C C GT GAAG GAAGT C C C CT T C T AC AC AG C G GC G 214 

M I I I I I I I I II I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
121 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCTCCTTCTACACAGCGGCG 180 

215 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

M I I I I I I I II II I I I I I I I M I I I I I I I I M II I I I I I I I I I I I I I I I I M I I I I I I I I 
181 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 240 

275 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

I I M | I II II I I I I II M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

241 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 300 

335 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 394 

| | I I I I I I I I I I I I I I I I I I I I 1 I I I I I 1 t I I 1 I I I I I I I I I 1 I I I I I I I I I I I I I I I I 1 
301 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 360 

395 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 454 

I || I I I I I I I I I I I I I I I I M I I I II I I I I II I I I I II I I I I I I I II I II I I I I M I I I I 

361 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 420 

455 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 514 
I I I I M I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I M M I I I I II I I I M I 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



421 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 480 

515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 574 

M I | I I M I I II I I I I I I M I I I I I II I I I II I I I I II I I I I I I I I I I I I M I I I I 11 I I 
481 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 54 0 

575 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 1 1 I I I I I I I I I I I I I I I I I II I M 

541 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 600 

635 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 694 

M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
601 CTGGATTCACAGTCTGGCCTCCACAAGGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 660 

695 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 754 

| | I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I II I I I I I I 
661 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 720 

755 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 814 

M I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 780 

815 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 874 

I I I I II I I I I MINI I II I I I I I I I I I II I I I I I I I I I I 

7 81 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 84 0 

875 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 934 

M | | | I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

841 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 900 

935 GGCCT GGAT GCCCCCAACGGCT CGGACT CCT CGCCACAGGCGCCACCCCCACGGAGGCTG 994 

M I I I I I II II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I 
901 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 960 

995 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

| | I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
961 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1020 

1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

|| | I I I I I I I I I I I I I I II I I I I M I I I I I II I I I M M I I I I I I II I I I I I I I I 

1021 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1080 

1115 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1174 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1081 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1140 

1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1234 

I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I 

1141 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 1200 

12 35 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1294 

III MINIM t I I I I 1 I i MM I M I I M I M II M II II II I I 

12 01 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1260 
1295 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

II II I II II M M I M I I I M 1 II M II I I III II I I II I II II I I II I I 

1261 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1320 



1355 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 1414 

| | | | | | | | | | I I | | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I i I I 
1321 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 1380 

1415 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1474 

| | | | | | | | | | | | | | | | | I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1440 

1475 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

I I I I I I I I I I II I I I I I I M I I I I Ml I II I I I I I I I I I I I I I 

1441 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1500 

1535 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

| | | | | | | | | | | | M | | M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1501 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 15 60 

1595 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

| | | | | | | | | | I I I II I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 

1561 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1620 

1655 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

M | | | | Ml II M I I I II II II I 

1621 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1680 

1715 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 1774 

| | | | 1 | | | | | I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M 
1681 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 1740 

177 5 AAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGAC 1834 

MINI II I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I 

1741 AAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGAC 1800 

1835 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 1894 

| | | | | I I I I I I M I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
1801 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 1860 

1895 CACGTGCACTACAAGATCCGCCAGAACTCCAGCTTCACCGAGAAAACCAACGAGATCCGC 1954 

| I I M | I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I M I I I M I I I 

1861 CACGTGCACTACAAGATCCGCCAGAACTCCAGCTTCACCGAGAAAACCAACGAGATCCGC 1920 

1955 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2014 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

1921 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 1980 

2015 GTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTG 2074 

| | | | I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I 

1981 GTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTG 2040 

2075 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2134 

| | | | | | | | | | I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

2041 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2100 

2135 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2194 

I I M I I I I I I I I I I I I M I I I I I II I I I I I I I M I II I I I I I I I I I I M I I I I I I I I I I I 
2101 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2160 



2195 GCCAT GACCAT CCAGCAC AT CGT GGCGGAGAAGGAGCAC CGGCT CAAGGAGGT GAT GAAG 2254 

| | | | | I I I I I I I I I I I I I I I I M I I I I II I I I I 1 I I I I I 1 I I I I I I I 

2161 G C CAT G AC CAT C C AG C AC AT C GT G GC GGAGAAGGAG C AC CGGCT C AAG GAG GT GAT GAAG 2220 

22 55 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

I I I I 1 I | | | | | I I I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I II 

2221 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2280 

2315 CTGTCCATCTCCGTGACAGCACTCACCGCCATCCTGAAGTACGGCCAGGTGCTTATGCAC 2374 

| | || | | | | || I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I Ml 

2281 CT GT CCAT CT CCGT GACAGC ACT C AC CGCCAT CCT GAAGT ACGGC CAGGT GCT TATACAC 2340 

2375 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2434 

I I I I I I I I I I I I I I M I I I M I I I I M I I I I I I I I I I I M I I I I I I I I I 

2341 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2400 

2435 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 24 94 

| | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

24 01 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2460 

2495 AT CTACTTCCTGAGCTAC GT GCCCTACATGTACGT GGC GAT CCGAGAGGAGGT GGC GCAT 2554 

I I I I M | I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

2461 AT CTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGAT CCGAGAGGAGGT GGCGCAT 2 52 0 

2555 GATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGT 2614 

| | | | || | | || | | II I I I I I I II I I I I I I II II I I I I I I I I I I I I I I I I I M I M I I I I I I 
2521 GAT AAG AT C AC G G C C T T C G AGAAGT G CAT CGCGTCCCT CAT G T C C AC G AC GGCCTTTGGT 2580 

2615 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2 674 

I Mill I I I I 1 1 I I I I 1 I I I I I I I I I I I I I I I 1 I 1 I I I I ■ ■ I ■ I 

2581 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2 64 0 

2675 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2734 

| | | | | | || | | | I I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I N I I I I I I I 
2641 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2700 

2735 AT GGT G GAC GC C GT GGT C T AT GGCAT CCT CACGT G GT AC AT T GAGGC T GT G C AC C CAG G C 2794 

| | | | | | | || | I I I I II I II II I I I II I I I I I II I I M I I I M I I II I I M I I I I I I M I I 
27 01 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2760 

27 95 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2854 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I ! I I I I I II I I M I I II 

27 61 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2820 

2 855 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2914 

1 1 1 1 ii ii i ii 1 1 1 1 ii 1 1 1 1 in M 1 1 1 NUN 

2821 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2880 
2 915 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 2974 

| | | I I I M I II I I I I I I II I I M I I I I I I I I I I I I I I I I M I I I I I i I I M I I I I I I I I I 

2 881 AT GGAG G AGGAC CAG GC CT GT G C CAT GGAGAGC C GGCGCTTT GAG GAG AC C C GT GGCAT G 2940 
2 975 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3034 

I I I I I M I II II I I I I I I I I I I I I I II I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I 

2 941 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3000 
3035 AAG GAC GAC AAG AAG CTGGCCCT G AAC AAG C T GAG CCT G AAC C T C T AC G AG AAC CAG G T G 3094 



Db 


3001 


M | | | | | I I 1 1 1 1 1 1 1 1 1 M 1 1 M 1 1 1 1 1 1 1 II 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 M M 1 1 1 N 
AA.GGACGACAAGAA.CjC 1 GbjL,L,L. i bAAUAA-oU i Lt/\^l^ x ^/v\^^ x ^ x j^^^j^jr^r\^\^r-L\jyj x ^ 


3060 


Qy 


3095 


GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 

| | | | | I I | | I I 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 II 

« m ^m^«mm/immrr'rr'P7\P7\ T\r t rT , r , r , r , mrr*'k Ar* AnnAnr ATP ATfiTCCATCCTGACCGGC 
GTCTCCTTCTTGGGCCACAACG(jo(aL.bbj(jL.AAoAU ^x ^.^^.x x o^.^^^^^ 


3154 


Db 


3061 


3120 


Qy 


3155 


CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 

| | | | | I I 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II II 1 II 1 1 1 

CTGTTCCCTCCAACGTCGGG 1 I LLbLLALLAl o i al^^^^-M.^ ij/v^/-vx ^^o^^^^^-^-vj^-l 


3214 


Db 


3121 


3180 


Qy 


3215 


GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 
| | | | | | | I I 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 

/- t nm/i^/-^T\ 7\*-7\7\ r< r^rnrr r P A m rTr pr* r f f 4 A r r A f A ATfZTf^CT CTTTC^AC C GGCTC 

GATGAGATCCGCAAGAACCTGGGCA1 CjL.U^^UA^l,/\^/\/\i ^x x nj^^ao^i^ 


3274 


Db 


3181 


3240 


Qy 


3275 


ACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCTCAGGAGGAGATC 
| | 1 | | | | 1 1 1 t 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

_ - t\ 7v /^r«rTt^'rnr , r-rnTir"T" Tvpmp 7\r*rT , r*Tf 1 A AfZAfZC ATflCrCTC AGCiAGCtAGATC 
ACGGTGGAGGAACACCTCTGG I 1 UlAL 1 LALbbU 1 u/\/vj/\bjo/\x x ^suj ^jr^sot^ j. ^ 


3334 


Db 


3241 


3300 


Qy 


3335 


C GC AGAGAGAT GGACAAG AT GAT C GAGGAC CT G G AGCT C T C CAAC AAAC GG C ACT CACT G 

M 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CGCAGAGAGATGGACAAGATGATCGAGGACCTGGAbu 1L1 bUAAUAAa^brbr^/v^ i i \d 


3394 


Db 


3301 


3360 


Qy 


3395 


GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 

1 1 1 I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 MMI Ml 

GTGCAGACATTGTCGGGTGGCATGAAGC(jLAAbjL,lbl uuiji ^^<^^x 1^1000^ 


3454 


Db 


3361 


3420 


Qy 


3455 


GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 

| || | | | | | | || I I II 1 II 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 M 1 1 1 1 M 1 M M 

GGCTCTCGCGCCATCATCCTGGACGAGCCCACbbubbbuCjl bbAUbLbiAbb^buvj^uLr^ 


3514 


Db 


3421 


3480 


Qy 

Db 


3515 
3481 


GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCATCCTTCTGTCCACCCAC 

| | | | | | | M I I I I II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 M 1 II 1 

GCCATCTGGGACCTCATCCTGAAGTACAAGCCAbGLL^UAL.u>\i bbi lbibiLLA^^rt^ 


3574 
3540 


Qy 


3575 


C ACAT GGAT GAGGCT GACCT GCTT GGGGACC GCATT GCCAT CAT CT CC CAT GGGAAGCT C 
| | || I 1 1 II II II M II 1 1 1 1 1 M M M 1 II 1 1 II 1 

^^mnoTim^T. r* r* m f 7\ ppmpr<mrrrrpr7Ar , pr , PATTcrraTrAT i rTrrrATnGGAAGCTC 
CACAT GGAT GAGGCT GACCT GC 1 i bbbCjALUbrOAx ibrULAX i^ai 1 1 LLt/ii uu^mu^i ^ 


3634 


Db 


3541 


3600 


Qy 


3635 


AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 

1 | | | M 1 1 1 1 II 1 1 M M 1 M II 1 1 1 1 M II 1 II II 1 1 1 M II 1 1 1 1 II 1 M II II II 1 1 

AAGTGCTGCGGCTCCCCGCTCTTCC1 CAAbCjbr^/\uu x Ax ^kjj^^i-v^^^^ 1 /v^^^^^- 1 ^• r ^^ v - 7 


3694 


Db 


3601 


3660 


Qy 


3695 


CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 

| | | M 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 M 1 1 1 1 1 1 1 1 1 I'll 

CTGGTCAAGCGGCCCGCCGAGLO(jCj(a(ab(jUUUUL.A^ J- ^^^<".x ^^j^sj^^^^ 


3754 


Db 


3661 


3720 


Qy 


3755 


CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 

| I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 IN 1 1 1 1 1 1 1 

__ rn „ 0 „„„^ r , / ^ r , rirnri7 , r>m\ pprrppfrpprarpfrrrAC^T^TrrrAnTTrATrrGCAAG 
CCAGGTCGGGCCCCGCTGAGCAGL1 bCl LbbAbbi uuALjiax w?x ^l.^/vjx x wax u^w^nnu 


3814 


Db 


3721 


3780 


Qy 


3815 


CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 

| M II M 1 II II 1 1 1 1 M 1 1 1 M II 1 1 1 M 1 1 M 1 1 M II 1 II 1 1 II II 1 1 M II 1 II 1 1 

CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 


3874 


Db 


3781 


3840 


Qy 


3875 


. AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 

I | | | | I | | M 1 1 1 1 II 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 II 1 1 1 1 1 1 M II II 1 II II 1 1 M 1 1 


3934 



3841 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 39 00 
3935 GAT G C ACT G C AC CT CAGC AG C T T C G GG CT GAT GG AC AC GAC C C T G GAG G AAGT GT T C CT C 3994 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 1 I I I I I I I I I I I I I I I M M I I I 

3901 GAT GCAC T GC AC CT C AG CAG CT T C GG GC T GAT G GAC AC GAC C CT GGAGGAAGT GT T C C T C 3960 
3995 AAGGT GT CGGAGGAGGAT CAGT CGCTGGAGAACAGT GAGGC CGAT GT GAAGGAGT C CAGG 4054 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

3961 AAG GT GT C GGAG GAGGAT CAGT C G CT GGAGAAC AGT GAG GC C GAT GT GAAG GAGT C CAG G 4 020 

4055 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I II I I I I I I I I I I I I 
4021 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4 080 

4115 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 4174 

I | | | | | | M I I II I I I I I I I I I I I I I I I I I II I I I I III I M I I I I M I I I I I M I I M I 
4 081 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 4140 

4175 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4234 

| | | | | | | || | I I I I I I I I I I I I I I I I I II II I I I I I I I I I M I I I I I I I I I I II I I I I I I 
4141 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 42 00 

4235 T TT GAT AAC CCACAGGACC CAGACAAT GT CAGC CT GCAAGAGGT GGAGGCAGAGGC CCT G 4294 

| | | I I I I I I I I I I I I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
42 01 T TT GAT AAC C CACAGGAC C CAGACAAT GT CAG CCT G CAAGAGGT G GAGG CAGAGGCC CT G 42 60 

4295 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4354 

| M | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I 
42 61 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4320 

4355 CACGGGCTGCTGGTCA7\ACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4414 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 
4321 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4 380 

4415 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 44 74 

M I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I II I 1 1 I I I I I I I I I I I I I I I I I I I I I I 

4381 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 44 40 

4475 GAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAG 4 534 

| | II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
4441 GAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAG 4500 

4535 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4594 

I I I I M I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I II I I I I I I I I I 

4501 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4560 

4 595 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4 654 

| | | I I I I I I I I I I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4561 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4620 

4655 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4714 

M I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I > I I I I I I I I I I I I I I I I I I I I 
4 621 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4 680 

4715 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 4774 

I M I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 681 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 4740 



Qy 


4775 


Db 


4741 


Qy 


4835 


Db 


4801 


Qy 


4895 


Db 


4861 


Qy 


4955 


Db 


4921 


Qy 


5015 


Db 


4981 


Qy 


5075 


Db 


5041 


Qy 


5135 


Db 


5101 


Qy 


5195 


Db 


5161 


Qy 


5255 


Db 


5221 


Qy 


5315 


Db 


5281 


Qy 


5375 


Db 


5341 


Qy 


5435 


Db 


5401 


Ov 


5495 


Db 


5461 


Qy 


5555 


Db 


5521 



ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4834 

I I I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I M M I I I I I I I I I I I I I I I I I I I I I 

ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 4 800 
TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 4 894 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I I I I I I I I I I I I I 

TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 4 8 60 

GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4 954 
I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I 

GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 4 920 

TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 5014 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 4980 

CC C C AGAT G C GGGT G GT CAC AGGC GACAT C CT GAC CG AC AT C AC C GGC C ACAAT GT C T CT 5074 

I I I I I I I I II I I I I I I I II I I I I I I I I I I II I I I I I M I I I I I I I I I II I I I I I 

C CC CAGAT G C GGGT G GT CAC AG G C GACAT C CT GAC C GACAT CAC C G G C C ACAAT GT C T C T 504 0 

GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5134 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 5100 

GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5194 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 5160 

AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACT^AGGGCTATCACAGCATG 5254 

I | | | | | I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AAGATCGCGGT GCGCAGGGCT GCCCAGGTTTT CTACAACAACAAGGGCTAT CACAGCATG 522 0 

C C CAC C T AC C T C AAC AG C C T C AAC AAC G C CAT CCTGCGTGC C AAC C T G C C C AAGAG C AAG 5314 

M I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 1 I I I II I I 

C C C AC CT AC CT CAACAGC CT CAACAAC G C CAT C CT GC GT G C CAAC C T G C CCAAGAGC AAG 52 8 0 

GGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCC 5374 
I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I 
GGCAAC C C G GC GG CT T AC GG CAT CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC CAGC GC C 5340 

AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 54 34 

I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 54 00 

GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 5494 
I I I I I I I I I II I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I 1 I I I I I I I II I I I I I I I 
GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 54 60 



I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 5614 

I || | | | | || I I I II I I I I II I I I II I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 558 0 



Qy 


5615 


GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 

1 | | | || M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 M 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 
GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCC1C1 It 


JO / 1 


Db 


5581 


J D 1 U 


Qy 


5675 


CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 

1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 




Db 


5641 


J / uu 


Qy 


5735 


CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 

I | | | | | | | | I 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 t 1 1 1 II 1 1 1 1 
CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCA1 CACCGLCACC 


5794 


Db 


5701 


c i £■ n 


Qy 

Db 


5795 
5761 


GT G GCC AC CT T C CT GCT AC AGCT CT T CGAGC AC GACAAG GAC CT GAAGGT T GT C AAC AGT 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 II 
GT G GC C AC CT T C CT G CT AC AG CT C T T CGAGC AC GACAAG GAC CT GAAG GTT GT CAAC AGT 


DODH. 

coon 

3 O Z U 


Qy 


5855 


TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 

1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 II 1 1 

TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACT^ACCTGGGCCACGGGCTCATGGAG 


5914 


Db 


5821 


c o o r\ 


Qy 

Db 


5915 
5881 


AT GGCCTACAAC GAGTACAT CAACGAGT ACT AC GC CAAGATT GGCCAGTTT GACAAGATG 

1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 M 1 1 1 I 1 1 1 1 1 1 1 M 1 1 1 II 1 1 1 1 1 1 1 

ATGGCCT ACAAC GAGTACAT CAAC GAGTACT ACGCCAAGATT GGCCAGTTT GACAAGAT G 


c; Q 1 A 

o y 4 u 


Qy 


5975 


AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 

| | | | | | I II I I I I I I I I I 1 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 
AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 




Db 


5941 


b U U U 


Qy 


6035 


GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 

1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 M 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 




Db 


6001 


/T r\ n 

bUbu 


Qy 


6095 


ATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGA 
| I | 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 11 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AT G CCT GT GT CT AC CAAGC CT GT G GAGGAT GAT GT GGAC GT GGC C AGT GAG CG GC AGC GA 


61 R4 


Db 


6061 


biz U 


Qy 


6155 


GT GCT CCGGGGAGACGCC GAC AAT GACAT GGT CAAGAT T GAGAACCT GACCAAGGT CTAC 
I | | | | | I I II I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 
GT G CT C C GG GGAGAC GCC GACAAT GACAT GGT CAAGAT T GAGAAC CT GAC CAAGGT CTAC 


bz 1 4 


Db 


6121 


on 
b 1 o U 


Qy 


6215 


AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 

I I I I I 1 1 1 1 1 I 1 1 II 1 1 1 1 1 II 1 1 II 1 II 1 1 II 1 1 II 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 M 1 M 1 
AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 


bz / 4 


Db 


6181 


oZ 4 U 


Qy 


6275 


GGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATG 

| I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
GGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGA1G 


bo O 4 


Db 


6241 


DjUU 


Qy 


6335 


CT GAC C G GC GAC GAGAG C AC GAC GG GG G GC GAGG C CT T C GT C AAT GGAC AC AG C GT G C T G 

I || I || I I 1 II I I I I 1 1 II II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CT GAC C GG C GAC GAGAGCAC GAC GGGGGGC GAGG CCTTCGTCAATGGACACAGCGT GCT G 


boy 4 


Db 


6301 


bo bU 


Qy 


6395 


AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 

M 1 M 1 1 1 1 1 M 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M II 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 


6454 


Db 


6361 


6420 


Qy 


6455 


GACGAGCTCACGGCCCGGGAGCACCT GCAGCT GTACACGCGGCT GCGT GGGAT CT CCT GG 


6514 



Db 


6421 


Qy 


6515 


Db 


6481 


Qy 


6575 


Db 


6541 


Qy 


6635 


Db 


6601 


Qy 


6695 


Db 


6661 


Qy 


6755 


Db 


6721 


Qy 


6815 


Db 


6781 


Qy 


6875 


Db 


6841 


Qy 


6935 


Db 


6901 


Qy 


6995 


Db 


6961 


Qy 


7055 


Db 


7021 


Qy 


7115 


Db 


7081 


Qy 


7175 


Db 


7141 


Qy 


7235 


Db 


7201 


Qy 


7295 



1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 I II I II I I II 1 1 II 

GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 648 0 

AAG GAC GAGG C C C G GGT G GT GAAGT G GGC T C T G G AGAAGCT G GAG CT GAC C AAGT AC G C A 657 4 

I I I I I I M I I II I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I 

AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 654 0 

GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6634 

I I I I I I I I I I I II II I I II II I I I I M I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6600 

CTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAG 6694 

I I I M II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

CT CAT T GGGT AC C CAG C CT T CAT C TT C C T G GAC GAG C C C AC C AC AGGC AT G GACC CCAAG 6660 

GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 6754 

I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I II II I I I II I II I I I I I I I I I 

GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 6720 

CTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTG 6814 

M I II I I I I I I II I I I I M I I I I I I I II II I I I I I I I I II II I I I I I I I I I I I I I I I I I I 

CTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCAT.CATGGTG 678 0 

AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 6874 

| | | I I II I I I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 684 0 

T ACAT GAT C AC GGT G CG GAC CAAGAGC AGC CAGAGT GT GAAG GAC GT G GT GC GGT T CT T C 6934 

I M I I I I I I II I I I I I I I I II I I M I I I I I I I I I I I I I M I I I I I I I I I I I I I M 

TACATGATCACGGTGCGGACCAAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTC 6900 

AACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAG 6994 

III I II I I I I Ill I I I I I I I I I I I I I I MINIMI 

AACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAG 6960 

CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 7054 

I || I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I M 
CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 7020 

GT G CT G GGC AT CGAGGACT ACT C GGT C AGC C AGACC ACACT G GACAAT GT GT T C GT GAAC 7114 

I I I I I I I I I I I I I I M I I I I II I I I I I II I I I I I I I I I I I I I I I I I M I I I I I I I 

GT GCT GGGCAT CGAGGACT ACT C GGT C AGC CAGACCAC ACT GGACAAT GT GT T CGT GAAC 7080 

TT T GC CAAGAAGC AGAGT GACAAC C T GGAGCAGCAGG AGAC G GAG C C GC CAT C CG C ACT G 7174 
I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
T T T GC CAAGAAGC AGAGT GACAAC CT GG AG CAG C AGGAGAC G GAGC C GC C AT C C GCACT G 7140 

CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 7234 

I | II I I I M I I I I I I I I I II I I I I I I I I I I I I II I I I M I I I I I I II M I I II I I I I M I 
CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 7200 

CGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGC 72 94 

I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I II I I I I I I I I I I I I I I I I I I I I 
CGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGC 7260 

TTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTC 733 9 
I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 7261 T T C GAG GAG GAG C GGG C C C AGCT GT C C T T CAAC AC G GACAC GCT C 7305 



RESULT 9 
US-10-199-485-9 

; Sequence 9, Application US/10199485 

; Publication No. US20030077 626A1 

; GENERAL INFORMATION: 

; APPLICANT: Glucksmann, Maria A. 

; APPLICANT: Silos-Santiago, Inmaculada 

; TITLE OF INVENTION: 20685, 579, 17114, 23821, 33894, and 

; TITLE OF INVENTION: 32613, No. US2 0030077 62 6Alel Human Transporters 

; FILE REFERENCE: 35800/249468 

; CURRENT APPLICATION NUMBER: US/ 10/ 199 , 4 8 5 

; CURRENT FILING DATE: 2002-07-18 

; PRIOR APPLICATION NUMBER: 09/795,693 

; PRIOR FILING DATE: 2001-02-28 

; PRIOR APPLICATION NUMBER: 60/185,906 

; PRIOR FILING DATE: 2000-02-29 

; NUMBER OF SEQ ID NOS : 42 

; SOFTWARE : FastSEQ for Windows Version 4.0 
; SEQ ID NO 9 

LENGTH: 7305 
; TYPE: DNA 

; ORGANISM: Homo sapiens 
US-10-199-485-9 

Query Match 90.8%; Score 7301.8; DB 15; Length 7305; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 7303; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

35 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAG7^ACGTGACGCTC7^AACGCCGG 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I II I I I I I 
1 ATGGGCTTCCTGCACCAGCTGCAGCTGCTGCTCTGGAAGAACGTGACGCTCAAACGCCGG 60 

95 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 154 

| | M I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
61 AGCCCGTGGGTCCTGGCCTTCGAGATCTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTG 120 

155 GGGCTGCGACAGAAGAAGCCCACCATCTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCG 214 

I I I I I I I I I I I I II M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I 

121 GGGCT G CGACAGAAGAAGC C C AC C AT CT C CGT GAAGGAAGT CT C CT T CT AC AC AGC GGCG 180 

215 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 274 

| | 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I 1 I I I I I 1 I I I I M I I 1 I I I I I I 
181 CCCCTGACGTCTGCCGGCATCCTGCCTGTCATGCAATCGCTGTGCCCGGACGGCCAGCGA 24 0 

27 5 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 334 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I M I 
241 GACGAGTTCGGCTTCCTGCAGTACGCCAACTCCACGGTCACGCAGCTGCTTGAGCGCCTG 300 

335 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 394 

I I I I I M I I I II I I I I I I I M I I I II I I I I I I I II II I I I I I I I I I II I I I I I I II I I I I 

301 GACCGCGTGGTGGAGGAAGGCAACCTGTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAG 360 
395 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 454 

I I I I II I I I I I I I I I I I M II I I I I I I I I I I II I I I I I I I I I I I M I I I I II I I I I I I M 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



361 CTCGAGGCCCTACGCCAGCATCTGGAGGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGC 42 0 
4 55 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 514 

I M | | | | | | | | | | I I I I I I II I I I I I I I II I I I I M I II II I II I I I II I I I I I M I I M 

421 CACCTGGACAGATCCACAGTGTCTTCCTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAG 4 8 0 

515 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 574 

| | | | | | | I I I I I I I I I II I II I I II I II I I I I I I M I I I I I I I I I I I I M I I I M I I I I I 
4 81 GAGCTCTGGCGTTTCCTGACGCAAAACTTGTCGCTGCCCAATAGCACGGCCCAAGCACTC 54 0 

575 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 634 

| | I I I M I I II I I M I I I I I I I I I I I I I I 1 I I 1 I I I I I I 1 I 11 I I I I I I I I I 1 I 1 I I I I I 

541 TTGGCCGCCCGTGTGGACCCGCCCGAGGTCTACCACCTGCTCTTTGGTCCCTCATCTGCC 600 
635 CT GGATT CACAGT CTGGCCT CCACAAGGGT CAGGAGCCCTGGAGCCGCCTAGGGGGCAAT 694 

M I I I I I II I I I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 CT G GAT T CACAGT CTGGCCTC C ACAAGG GT C AG GAG C C CT GGAG C C G C CT AG G GGG C AAT 660 
695 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 754 

I | | | | | M II I II II I I I I I I I M I I I I II I I I I I I I I I I I I I I I I I I M I II I I II I I I 

661 CCCCTGTTCCGGATGGAGGAGCTGCTGCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGC 720 

7 55 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 814 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I 

721 ACGCCGGGCTCGGGGGAGCTGGGCCGGATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCC 7 80 

815 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 874 

I MM MM MM I I I I I I 1 M 1 I M II I I IN INN MIIMI 

7 81 CTGCAGGGCTACCGGGATGCTGTCTGCAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTC 84 0 

875 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 934 

| | M I II I I I I I I I I II I I II I I I I I I I I I I I I I M I I M I I I I I I I I I I I I I I I I I I I I 
841 TCTGGGCTGTCTGCTGAGCTCCGGAACCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTG 900 

935 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 994 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

901 GGCCTGGATGCCCCCAACGGCTCGGACTCCTCGCCACAGGCGCCACCCCCACGGAGGCTG 960 

995 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1054 

| M I I I I I II I I II I I I I I I I I I I I I I II I I I I I I I 

961 CAGGCGCTTCTGGGGGACCTGCTGGATGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTG 1020 

1055 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 1114 

I M II II I I II I I I I I I I I I I I I M 11 I I I I I I II I I I I I 

1021 TCGGCCCTGGCCCTGCTACTGCCCCAGGGTGCCTGCACTGGCCGGACCCCCGGACCCCCA 108 0 

1115 GCCAGTGGTGCGGGT GGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1174 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I M I I 

1081 GCCAGTGGTGCGGGTGGGGCGGCCAATGGCACTGGGGCAGGGGCAGTCATGGGCCCCAAC 1140 

1175 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 12 34 

I 1 I I 1 I I I I I I I I IIMM I I I II I I I I II I I I I MM 

1141 GCCACCGCTGAGGAGGGCGCACCCTCTGCTGCAGCACTGGCCACCCCGGACACGCTGCAG 12 00 

1235 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1294 

M I I I I I II I II II I II I I II I II I M I I M M II II I II II II M I I I 

1201 GGCCAGTGCTCAGCCTTCGTACAGCTCTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAAC 1260 



1295 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1354 

I I I I | | | | | | | I I I I I I I I I I I I I I I I I I I I I I II I II I II I I I I I I I I II I I I 

1261 AACCGCACCATTGAACCCGAGGCGCTGCGGCGGGGCAACATGAGCTCCCTGGGCTTCACG 1320 

1355 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 1414 

I II I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I IN 

1321 AGCAAGGAGCAGCGGAACCTGGGCCTCCTCGTGCACCTCATGACCAGCAACCCCAAAATC 138 0 

1415 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1474 

I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 CTGTACGCGCCTGCGGGCTCTGAGGTCGACCGCGTCATCCTCAAGGCCAACGAGACTTTT 1440 

1475 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1534 

I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 GCTTTTGTGGGCAACGTGACTCACTATGCCCAGGTCTGGCTCAACATCTCGGCGGAGATC 1500 

1535 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I 
1501 CGCAGCTTCCTGGAGCAGGGCAGGCTGCAGCAACACCTGCGCTGGCTGCAGCAGTATGTA 1560 

1595 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 1654 

| | | | | I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
1561 GCAGAGCTGCGGCTGCACCCCGAGGCACTGAACCTGTCACTGGATGAGCTGCCGCCGGCC 162 0 

1655 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1714 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1621 CTGAGACAGGACAACTTCTCGCTGCCCAGTGGCATGGCCCTCCTGCAGCAGCTGGATACC 1680 

1715 ATTGACAACGCGGCCTGCGGCTGGATCCAGTTCATGTCCAAGGTGAGCGTGGACATCTTC 177 4 

| | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I 
1681 AT T G AC AAC GC GG CCT G C G G CT G GAT C C AGTT C AT GT C C AAGGT GAG C GT GGACAT CT T C 1740 

17 75 AAGGGCTTCCCCGACGAGGAGAGCATTGTCAACTACACCCTCAACCAGGCCTACCAGGAC 1834 

I | | | | | | I I I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I 

1741 AAG GGCT T C C C CG AC GAG G AGAGC AT T GT C AACT ACAC CCT CAAC CAG G C CT ACC AGGAC 18 00 
1835 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 94 

I M | I I I I I I I I I I I II I II I I I I I I I I I I I I II I I I M I I I I I I I I I I I I I I I II I I I I 

18 01 AACGTCACTGTTTTTGCCAGTGTGATCTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCT 18 60 
18 95 C AC GT GCACTACAAGAT C C GC C AGAACT CC AGCT T CAC C GAGAAAAC CAAC GAGAT C CGC 1954 

I | M M I I I I I I I I I I I I I II I II I I I I I I I I I I II I I I I I I I I I I I I M I I II I I I I I I 

1861 CAC GT GCACTACAAGAT CC G C C AGAACT C C AGCT T CAC CGAGAAAAC CAAC GAGAT C C G C 1920 
1955 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 2014 

I M I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I II 

1921 CGCGCCTACTGGCGGCCTGGGCCCAATACTGGCGGCCGCTTCTACTTCCTCTACGGCTTC 1980 
2015 GT CT G GAT C CAGG ACAT GAT GGAGC GC G C CAT CAT CGACACT T T T GT GG G GCAC GAC GT G 2074 

|| I I I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I II II I I I I I I I I II I I 

1981 GTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACACTTTTGTGGGGCACGACGTG 2 04 0 

2075 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2134 

| | M | || II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 041 GTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCTGCTACACACGCGATGACTTC 2100 



2135 CT GTT T GT CAT T GAGCACAT GAT GCC GCT GT GCAT GGT GAT CT C CT GGGT CT ACT C C GT G 2194 

M I I I I M I I I I I I M I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I 

2101 CTGTTTGTCATTGAGCACATGATGCCGCTGTGCATGGTGATCTCCTGGGTCTACTCCGTG 2160 

2195 GC CAT GAC CAT C CAGCAC AT CGT GGC GGAGAAGGAGC ACC GGCT CAAGGAGGT GAT GAAG 2254 

| | || || | | | | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2161 GC CAT GAC CAT C CAGCAC AT CGT G GC G G AGAAG GAGC AC C GGCT CAAGG AG GT GAT GAAG 2220 

2255 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2314 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I 
2221 ACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAG 2280 

2315 CT GT C CAT CT CC GT GAC AGCAC T CAC C G C CAT C CT GAAGT ACGGC CAGGT G CT T AT GC AC 2374 

| | | | | | I I I I I I I I II I I I I I II I I I I I I I I I Ml 

2281 CT GT C CAT CT C C GT GACAGCACT CAC C GCCAT C CT GAAGT ACGGCCAGGT GCT TAT ACAC 2340 

2375 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2434 

| | | 1 | I I I I I I I I I 1 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2341 AGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACGCGGTGGCCACCATCATGTTC 2400 

2435 TGCTTCCTGGTGTCTGTGCTGTACTCCT^AGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2494 

I I I I I I I I I I M M I I I I I II I I I II I I II I I I I 1 1 M I I I I I I I I I I I I I I I I I I I I I I 

24 01 TGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATC 2460 
2495 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 2554 

Ml IMIIMIIIIIIIIIIIl II II II M MM MM Mill I MINIMI 

2461 ATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGATCCGAGAGGAGGTGGCGCAT 252 0 
2 555 GAT AAGAT CAC GGC CT T C GAGAAGT GCAT CGCGTCCCT CAT GT C CAC GAC GG C CT T T G GT 2614 

I I I I || I I I I I I M I II I I M I I I I I I I I I M I I I I I I I I I II I I II I I I II I I I 

2521 GATAAGATCACGGCCTTCGAGAAGTGCATCGCGTCCCTCATGTCCACGACGGCCTTTGGT 258 0 
2 615 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2674 

I I I I M I MM I M I I I II I I I I I I I I I I I I M I I I I I I M I I I I I I I 

2581 CTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCGTGGGCATCCAGTGGCACACC 2640 
2675 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 2734 

I | | | | | || I I I II M I I M I I I I II I M I I I II II M I M I I I I I I II I I I M II M I I I 

2641 TTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGCTCCTGGCTGTCACCATGCTG 27 0 0 

2735 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2794 
I | || | II I I M I II I I II I I M I I I I I I I I I I I I I I I I II I I I II M I I I I I I I I I M M 

2701 ATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGC 2760 
27 95 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2 854 

II I II II M I M I M I I I I I Ml Ml 

27 61 ATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGT 2 820 
2855 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 2914 

I I II I M I II I I M I I I I II I I II I I I I I I I I I I I M I I I I I I I I II II I I I II 

2 821 GGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTC 288 0 

2 915 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 2 974 

I I M I M I II I I II I II II II II I I II I I M M II I I I II II II I I I I I I M II 

2 8 81 ATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATG 294 0 

2 975 GAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTAC 3034 



Db 


2941 


I | M | | | | | | | | I | I I I 1 i 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 Ml 

GAG GAGGAG CC CAC C C AC CTGCCTCTbbllblblbbblb bAbAAAb l LAL L-AAub i b i /-^ 


3000 


Qy 


3035 


AAG GAC G AC AAGAAG CTGGCCCT GAAC AAGC T GAG C CT GAAC CT C T AC GAGAAC C AG GT G 

1 I I 1 1 I I I M 1 II 1 1 1 1 1 1 M 1 1 1 1 1 II 1 1 1 1 M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AAG GAC GACAAGAAG CT G G C C CT GAACAAb b 1 bAbbb 1 bAAb AL bAbAAb b Abbr j. ^ 


3094 


Db 


3001 


3060 


Qy 


3095 


GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGC 

| | | M | | | | | | || | | I I II 1 1 1 1 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 II 1 1 

GTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGAbbAbbAbbAl bl LLA1 LL1 bAbbbbL, 


3154 


Db 


3061 


3120 


Qy 


3155 


CTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGCACGACATCCGCACGGAGATG 

1 I 1 1 II 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 Mill 

CTGTTCCCTCCAACGTCGGGTTCCGCCACCATClAbbbbbAbbAbAl LLbLAtbbAbAi b» 


3214 


Db 


3121 


O -L U W 


Qy 

Db 


3215 
3181 


GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTC 

1 1 M 1 1 1 1 II 1 M 1 M M 1 II M 1 1 1 M 1 1 M 1 M 1 II 1 

GATGAGATCCGCAAGAACCTGGGCATGTGCCCGCAGbAbAAl blbblbi 1 ibAbbbbbib 


3274 

J T U 


Qy 


3275 


AC GGT GGAGGAAC ACCT CT GGT T CTACT CAC GGCT CAAGAGCAT GGCT CAGGAGGAGAT C 

| | | | | | | I I I I I 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 M II 1 1 1 1 II II 1 1 1 1 1 1 1 1 Mill 

ACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGAGCATGGCI bAbbAbbAbAl b 


3334 


Db 


3241 


O O \J \J 


Qy 

Db 


3335 
3301 


CG CAGAGAGAT GGACAAGAT GAT C GAGGAC CT G GAGC T CT C CAACAAAC G GC ACT CAC T G 

M | | | || || | | || 1 1 II II 1 1 1 1 1 1 1 1 II 1 1 1 1 II II 1 II 1 1 M M 1 1 1 1 1 1 1 1 II 1 II 1 

_ _ _ _ _ _ _ _ _ _ ^ ~ ~. ~ r*r+ 7v r* r~*mf*< /— 7\ ^r^ni/^n^/^/^7VA/^7A7A7APPPP7APT 1 P71P , T , f^ 

CGCAGAGAGAT GGACAAGAT GAT CGAGGACCTGGAGCTCTCbAAbAAAbbbbAb 1 bAL i b 


3360 


Qy 


3395 


GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGC 

| I 1 II 1 1 1 II 1 1 M II 1 II 1 1 M 1 1 1 1 M 

GTGCAGACATTGTCGGGTGGCATGAAGCGCAAGCTbl bbbl bbbbAl bbbbi i bbi brbibiL. 


3454 


Db 


3361 


3420 


Qy 


3455 


GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGC 

I | II 1 II 1 1 1 1 1 1 M 1 1 1 1 II 1 M M 1 MM Mill 

GGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCGTGbAbbbbiAbbbbbbbbbb 


3514 


Db 


3421 


^4 RO 


Qy 


3515 


GC C AT C T G G GAC CT CAT C C T G AAG T AC AAG C C AG GC C GC AC CAT CCTTCTGTC CAC CC AC 

| I I I I 1 1 1 II 1 1 II II M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M II 1 1 1 MM 

GCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCACCAIbbl IblblbbAbbbAL 


^S74 

J J / T 


Db 


3481 


3540 


Qy 


3575 


CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTC 

|| | | || | | I I II 1 1 II II II 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 M 1 II 1 1 1 1 1 1 1 1 M M 1 II 1 
CACATGGATGAGGCTGACCTGCTTGGGGACCGCATTbbbAl bAlbl LbbAi bbbAAbbi ^ 


3634 


Db 


3541 


3600 


Qy 


3635 


AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACG 

| | | | | | | | I I I 1 1 1 II II M 1 1 1 1 1 1 1 1 1 1 M M M II 1 II 1 1 1 1 1 1 1 1 M 1 M 1 

AAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCAbblAlbbbbAbbbblAU^bi^^io/\^^ 




Db 


3601 


3660 


Qy 


3695 


CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCC 

| | | | | | | I 1 1 1 1 1 1 1 1 M II 1 1 II II II 1 1 II 1 II II II II 1 1 1 M 1 II 1 II 1 

CTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAbAbbbAbbbb l bbbAi 


3754 


Db 


3661 


3720 


Qy 


3755 


CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCT^AG 

| | | | | | | I II II 1 1 II 1 II 1 II 1 M 1 M 1 1 1 II II II II 1 1 1 1 1 M 1 1 1 M 1 1 II 1 II II 

CCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAG 


3814 


Db 


3721 


3780 


Qy 


3815 


CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 

M 1 1 1 1 1 1 1 M 1 1 1 1 II II 1 1 1 1 II 1 II 1 1 1 M 1 1 M II 1 II 1 1 II M II II 1 1 M M M 


3874 



37 81 CATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCC 3840 

3875 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3934 

I I M I I II I II I II | M I I I I I I I II I I i I II I I I I I I I I I I I I I M I I I II I I 

3841 AGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTG 3900 

3935 GAT G C ACT GC AC CT C AGC AGCT T C GGGCT GAT GGAC AC GAC C CT G GAGGAAGT GT T C CT C 3994 

I I I I MINIMI I I I I Ml I I I I I I I I II I I I I MM 

3901 GAT GC AC T GC AC CT C AG C AG CTTCGGGCT GAT G GAC AC GAC C CT G GAGGAAGT GT T C CT C 3960 

3995 AAGGT GT C GGAGGAGGAT CAGT CGCT GGAGAACAGT GAGGC CGAT GT GAAGGAGT CCAGG 4054 

| | | I I I II M I II M M II I M M II I I M I I I M I II I II II I I 

3961 AAGGT GT CGGAGGAGGAT CAGT CGCT GGAGAACAGT GAGGC CGAT GT GAAGGAGT C CAGG 4020 

4055 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4114 

I I I I II I II II II II I I M M M I I II II M M I I M M I M M I I I I II I II I I 

4021 AAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTG 4 080 

4115 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 4174 

| | || | | | | M I I II I II I I I I II I I I I I I I I I M I I I M I M I I II II II I I II I M M I 

4 081 GCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGC 414 0 

4175 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 4234 

M II I II I I II I I II M M M II II I M I I II II II M I I M M I M I 

4141 TCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTC 420 0 

4235 T T T G AT AAC C C AC AG GAC C C AG AC AAT GT C AG C C T G C AAG AG G T G GAG G C AG AG G C C C T G 4294 

| | | | || || II II II II I II I II M II II I II II II I I I M I I I I I 

42 01 T T T GAT AAC C CAC AGGAC C CAGACAAT GT C AGC CT GCAAGAGGT G GAGGC AGAG GC C CT G 4260 

4295 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4354 

| || I II II II II I II I I I M I I M M M I M I M I I M II II I I II II II I II II I I I I I 
4261 TCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTC 4320 

4355 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4414 

I || I I I II II I M I I I II M Illllll II I M I I I I I M I II I M M 

4321 CACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCC 4380 

4 415 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4 474 

M II I I M M I II II II I I II M I I I I I M I M M I I I M I I II II I I II I I I 

4 381 CAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCG 4 44 0 

4475 GAG AT T G GT GAT CTGCCCCCGCTGGTCCTGT C AC CT T C C CAGT AC C AC AACT AC AC C C AG 4534 

|| | || II I II II II II I I I II I I I M M M I II M I II I I I II I II I II I I I I I I M I II 
4441 GAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAG 4500 

4535 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4594 

| | | | | || | I I I I I I I I I II II II I II I I M I II M I II II I M II M I II I I M I II I II 
4501 CCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTA 4560 

4595 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4 654 

| | | | | || I I I II II II II I II I M II M I M II M I I I I II II I I I I M I I I I II I II II 

4 561 TCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGT 4 620 

4 655 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4714 

| | | || | || I II II I II I I M M II I I I I I I I II 1 I I II I I I II I II M II I I I I I I M II 
4 621 GCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGC 4 680 



Qy 


4715 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 

i i i i i i i i i i i i i i i i i i i I I I I I I I I I l I I I l I l l l l 1 l l 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
| 1 1 1 | | | 1 | | | M 1 1 1 1 1 1 1 1 II 1 1 1 1 II 1 1 1 1 II 11 1 1 1 1 II 1 1 1 M 1 1 1 1 1 1 11 ! 1 1 l 

4681 AGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTC 


4774 


Db 


4740 


Qy 


4775 ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 

I I M 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 M 1 1 1 

4741 ACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGAC 


4834 


Db 


4800 


Qy 


4835 


TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 

| I I I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 
TCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCT 


4894 


Db 


4801 


4860 


Qy 


4895 


GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 

| | | | | | | | | | I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 
GGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGC 


4954 


Db 


4861 


4920 


Qy 


4955 


TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 

M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCG 


5014 


Db 


4921 


4980 


Qy 


5015 


C C C C AGAT G C GG GT GGT C AC AG GC GAC AT C CT GACC GACAT CACC GG C C ACAAT GT CT CT 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGACATCACCGGCCACAATGTCTCT 


5074 


Db 


4981 


5040 


Qy 


5075 


GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 

| | II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 
GAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTT 


5134 


Db 


5041 


5100 


Qy 


5135 


GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 

| | | | | | | | | | I I I I 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 
GGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGG 


5194 


Db 


5101 


5160 


Qy 


5195 AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 

I I 1 1 1 M I 1 1 1 1 1 1 1 1 1 1 ( I 1 1 I 1 1 1 1 1 1 1 M 1 1 M II 1 1 1 1 1 1 1 1 1 1 1 1 1 ! 1 1 1 1 1 I 1 ! 

5161 AAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACAACAAGGGCTATCACAGCATG 


5254 


Db 


5220 


Qy 


5255 


CCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAG 

1 M 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 

CC C AC CT AC CT CAAC AG C CT CAACAAC GC C AT C CT GC GT GC CAAC CT GC C CAAGAG CAAG 


5314 


Db 


5221 


5280 


Qy 


5315 


GGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGAATAAGACCAGCGCC 

| | | I I I I I I I I 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 M 1 1 
GGCAAC C C GGC G GCT T AC GG C AT CAC C GT C AC CAAC C AC CC CAT GAAT AAGAC CAG C G C C 


5374 


Db 


5281 


5340 


Qy 


5375 


AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 

I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATC 


5434 


Db 


5341 


5400 


Qy 


5435 


GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
GTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACC 


5494 


Db 


5401 


5460 


Qy 


5495 


AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 

II 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 II II II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 M 
AAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAAC 


5554 


Db 


5461 


5520 



Qy 5555 TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 5614 

I I I I I I I I I I I I I I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5521 TACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTT 5580 

Qy 5615 GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 5674 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I II I I I 

Db 5581 GTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTC 5 640 

Qy 5675 CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 5734 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I 

Db 5641 CTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTC 57 00 

Qy 5735 CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 57 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5701 CCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACC 5760 

Qy 5795 GT GGCCACCTTCCT GCTACAGCT CTT CGAGCAC GACAAGGAC CTGAAGGTTGT CAAC AGT 5854 

I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I 

Db 5761 GTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGT 5820 

Qy 5855 TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 5914 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 5821 TACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAG 588 0 

Qy 5915 AT GGCCT ACAACGAGT ACAT CAAC GAGT ACTAC GCCAAGATTGGCCAGTTTGACAAGAT G 5974 

I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5881 AT GG C CT ACAAC GAGT AC AT CAAC GAGT ACT AC GC CAAGAT T GGC C AGT T T GACAAGAT G 594 0 

Qy 5975 AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 6034 

I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I 

Db 5941 AAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGC 6000 

Qy 6035 GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 6094 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6001 GTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGC 6060 

Qy 6095 AT GC CT GT GT CT AC CAAG C CT GT G GAGGAT GAT GT GGAC GT G G C C AGT GAGC GGC AGC GA 6154 

I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 6061 ATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGA 6120 

Qy 6155 GT GCT C C GG G GAGACGC C GAC AAT GACAT G GT CAAGAT T GAGAAC CT GAC CAAGGT CT AC 6214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I 

Db 6121 GT GC T C C GGGGAGAC GC C GAC AAT GACAT G GT CAAGAT T GAGAAC CT GAC CAAG GT CT AC 6180 

Qy 6215 AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 6274 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 

Db 6181 AAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCT 6240 

Qy 6275 GGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATG 6334 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I I I 

Db 6241 GGCGAGTGCTTCGGGCTCCTGGGCGT CAAC GGTGCGGGCAAGACCAGCACCTT CAAGAT G 6300 

Qy 6335 CTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTG 6394 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I 

Db 6301 CTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTG 6360 



Qy 



6395 AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 64 54 



Db 



I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
6361 AAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTC 6420 



Qy 6455 GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 6514 

I I I I I I II M I I I I I I I I I II I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 6421 GACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGG 6480 

Qy 6515 AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 6574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 6481 AAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCA 6540 

Qy 6575 GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6634 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6541 GACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCC 6600 

Qy 6635 CTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAG 6694 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 6601 CT CAT T G GGT AC C C AG C CT T C AT CT T C C T G GAC GAGCC CAC CAC AG GCAT G GAC C C C AAG 6660 

Qy 6695 GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 6754 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6661 GCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAGGGCGTTCAGTGGTG 6720 

Qy 6755 CT GACAT CACACAGCAT GGAGGAGT GCGAGGCGCT GT GCACGC GGCT GGCCAT CAT GGT G 6814 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 6721 CTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTG 6780 

Qy 6815 AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 6874 

I I I I I I I I I I I I I I I I I I II I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6781 AACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACCGGTTTGGAGATGGC 6840 

Qy 6875 T AC AT GAT CAC GGT GCGGAC CAAGAG C AGC CAGAGT GT GAAG GAC GT GGT G C G GT T CT T C 6934 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 6841 T AC AT GAT CAC GGT GCGGAC CAAGAG CAGC CAGAGT GT GAAGGAC GT GGT G CGGTTCTTC 6900 

Qy 6935 AAC C GCAACTT C C CGGAAGC CAT GCT CAAGGAGC GG C ACC ACAC AAAG GT G CAGT AC C AG 6994 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6901 AAC C G CAAC TT C C CGGAAG C CAT GCT C AAGGAG C GGC AC C ACAC AAAG GT G CAGT AC C AG 6960 

Qy 6995 CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 7054 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6961 CTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGC 7020 

Qy 7 055 GTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACAATGTGTTCGTGAAC 7114 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I I 
Db 7021 GT GCT GGGCAT CGAGGACTACT CGGT CAGC CAGACCACACT GGACAAT GTGTT CGT GAAC 7080 

Qy 7115 T T T G C C AAG AAG CAGAGT GAC AAC C T G GAG C AG C AG GAG AC G GAG C C G C CAT C C G CAC T G 7174 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 081 T T T G C C AAG AAG C AG AG T GAC AAC C T G GAG C AG C AG GAG AC G GAG C C G C CAT C C G CAC T G 714 0 

Qy 7175 CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 7234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7141 CAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTC 72 00 

Qy 7235 CGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGC 72 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 



Db 72 01 C GG G CACTT GT GGCAGAC GAG C C C GAG GAC CT GGAC AC G GAGGAC GAG GG C C T CAT C AG C 72 60 



Qy 72 95 TTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTC 7339 

I | | M I I I I | I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 72 61 TTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTC 7305 
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Query Match 72.3%; Score 5810; DB 12; Length 8040; 
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Matches 6768; Conservative 0; Mismatches 1205; Indels 85; Gaps 15; 



Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I I I I 
Db 34 CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 93 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I II II I I I I I 
Db 94 GCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGGAGCCCGTGGGTCCTGGCGTTTGAGAT 153 

Qy 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I I I I I I I I I I I I II II I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I M 
Db 154 CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 213 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 240 

III I I I I I I I I I I I I I I I I I I I II II II I I I I I II I I I I I I I I II I I I I 
Db 214 CTCTGTGAAGGAAG CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 300 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I II Mill I I I I I I I I I I I I I I II 
Db 271 TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 330 

Qy 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 331 CAACTCCACGGTCACCCAGCTTCTGGAACGCCTCAACCGTGTAGTGGAAGAGAGCAACTT 390 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 

I I I I I I I I I I I III II I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I 

Db 391 GTTTGACCCAGAGCGACCTAGCCTGGGCTCAGAGCTTGAGGCACTGCACCAACGTCTGGA 4 50 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 480 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 451 GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 510 

Qy 481 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 511 CTTCTCTCTGGACTCGGTGGCCAGGGACAAAAGAGAGCTTTGGCGTTTCCTGATGCAGAA 570 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I II I I I I I III 

Db 571 CCTGTCACTGCCCAACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I II I I I 1 I 

Db 631 GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 690 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I 
Db 691 GAAGC AGGAG CC CT G GAGT CAC CT GGGT AG CAAT C CT C T GT T CCAAAT G GAGGAG CT G CT 750 

Qy 721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 80 

I I I I II I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 751 GCTGGCTCCTGCCCTTTTGGAGCAACTCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 810 

Qy 7 81 GATCCTCACTGTGCCTGAGAGTCAGAAGGGAGCCCTGCAGGGCTACCGGGATGCTGTCTG 84 0 

I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 811 GATTCTTACCATGCCTGAGGGTCATCAGGTAGACCTTCAGGGCTACCGGGATGCTGTCTG 87 0 



Qy 



841 CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGT^A 900 



Db 



I I I I I I I II I I I I I I I I I I I I M Ml II I I I I I I I I I I I I I I I I 
871 CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 930 



Qy 901 CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

I I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 931 CCAGCTGGACATAGCCAAGATTGCCCAGCAGCTGGGCTTCAATGTCCCCAACGGCTCAGA 990 

Qy 961 CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 991 TCCACAGCCGCAGGCACCGTCCCCACAGAGTCTGCAGGCACTCTTAGGGGACCTGCTGGA 1050 

Qy 1021 TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I II 

Db 1051 TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 1110 

Qy 1081 GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 114 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1111 AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 1170 

Qy 1141 TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 12 0 0 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I II 
Db 1171 C AG C AC C GG G GT AGG G GC AAAT AC AGGT C C C AAC AC C AC C GT T GAG GAG G G C AC C C AGT C 1230 

Qy 1201 TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

III II I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I 
Db 1231 ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 1290 

Qy 12 61 CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

I I I I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 1 I I I I II II II II 
Db 1291 CTGGGCTGGCTTGCAGCCCATCTTGTGTGGCAACAACCGTACCATTGAGCCTGAAGCACT 1350 

Qy 1321 GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 138 0 

III I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I II II I I I I I I I I I I I I I I 
Db 1351 CCGGAGGGGCAACATGAGCTCACTGGGCTTTACGAGCAAAGAACAACGGAACCTGGGCCT 1410 

Qy 1381 CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II II II II I I II I I I 

Db 1411 TCTTGTGCACCTCATGACCAGCAACCCCAAAATCCTGTATGCACCCGCAGGCTCTGAAGC 1470 

Qy 1441 CGACCGCGTCATCCTCAAGGCCAACGAGACTTTTGCTTTTGTGGGCAACGTGACTCACTA 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I 
Db 1471 T GACC AT GT TAT C CT CAAGGC AAAT GAGAC CT TT GC CT TT GT GGG CAAC GT GAC GCACT A 1530 

Qy 1501 TGCCCAGGTCTGGCTC7UVCATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

I I I I I I I I I I I I II I I I II I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1531 CGCCCAGGTCTGGCTCAACATCTCCGCAGAGATCCGGAGCTTCCTGGAGCAGGGCAGGCT 1590 

Qy 1561 GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 

I I I I I I II I I I I I I I I I I I II I I I I I I II II II II I I I I I I II II II II 
Db 1591 GCAGCAGCATCTGCACTGGCTGCAGCAGTACGTGGCTGACCTCCGGCTACACCCTGAAGC 1650 

Qy 1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I II II III I I I I I I I I I I I I I I I I I 
Db 1651 AATGAACCTGTCACTGGACGAGCTGCCCCCTGCTCTGCGCCTGGACTACTTTTCTCTGCC 1710 

Qy 1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 174 0 

I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I II I I I I I I I I I I I I i 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1711 CAAT GGC AC AG CCCTTCTG CAG CAG CT AGACAC AAT AGACAAT G CAG C CT GT GGCT G GAT 17 7 0 

17 41 C CAG T T CAT GT C C AAG G T GAG C G T G G AC AT C T T C AAG GGCTTCCCC G AC GAG G AGAG CAT 1800 

I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I II II II I I I I I I I I I I I 
1771 C C AGTT CAT GT C C AAGGT GAGT GT G GAC AT CT T CAAG GGGTTTCCT GAT GAG GAGAGC AT 1830 

18 01 T GT C AACT AC AC C CT C AAC CAG G C C T AC C AGGAC AAC GT C AC TGTTTTTGC C AGT GT GAT 18 60 

|| I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I 
1831 C GT GAACT AC ACT CT CAAT CAG G C C T AC CAG GAC AAT GT T AC AGT AT T T GC CAG C GT GAT 1890 

1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 1920 

I I I I I I I I I I I I I I I I II II I M I I M M II II I I I I I I I I I I I I I I I I 
18 91 T T T C CAG AC AC G G AAGG AT GGTTCCCTCCCCC C AC AT GT C CAT T AC AAG AT T C G C C AGAA 1950 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 198 0 

Ml | I I I I I II I I I I I I I I I I I I I I I I I I I I I M II I I I I I I I I II I I I I I I I I 
1951 CT CAAGCTT CACCGAGAAAACCAACGAGAT CCGT CGTGCTTACT GGCGTCCAGGGCCCAA 2010 

1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 204 0 

Mill I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II II 
2011 CACTGGTGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATAGAACG 207 0 

2 041 C G C CAT CAT C GAC ACT T TT GT G GG GCAC GACGT G GT G GAGC CAGGC AG CT AC GT GCAGAT 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I 
2 071 T GCC AT CAT CAAC AC GT TT GT G GG G CAC GAC GT G GT C GAAC C C G GC AACT AC GT G CAGAT 2130 

2101 GTTCCCCTACCCCTGCTACACACGCGATGACTTCCTGTTTGTCATTGAGCACATGATGCC 2160 

I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2131 GTTCCCGTACCCCTGCTACACCCGTGACGACTTCCTGTTTGTCATTGAGCACATGATGCC 2190 

2161 GC T GT G CAT G GT GAT CT CC T G GGT CT AC T C CGT GGC C AT GAC CAT C C AGC ACAT C GT GG C 222 0 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2191 ACTGTGCATGGTGATCTCCTGGGTTTACTCTGTGGCCATGACCATACAGCACATCGTGGC 2250 

2221 G GAGAAGGAGCAC CG GCT CAAG GAG GT GAT GAAGAC CAT GG GC CT GAACAAC GC GGT GC A 2280 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I! II I I I I I I I 
2251 GGAGAAAGAGCAT CGGCTAAAGGAGGTGAT GAAGAC GAT GGGCCT GAACAAC GC CGT GCA 2310 

2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II 
2311 CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 237 0 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I II I I I 
2371 CGCCATCCTCAAGTATGGCCAGGTCCTCATGCACAGCCACGTGCTCATCATATGGCTCTT 24 30 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 2460 

III I I I I I II II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2431 CCTTGCTGTCTATGCTGTGGCCACTATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 90 

24 61 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 252 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I 
2491 TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 

2521 CATGTACGTGGCGATCCGAGAGGAGGTGGCGCATGATAAGATCACGGCCTTCGAGAAGTG 2580 

I I I I I I II I I I I I I I Mill II II II II I I II I I I I I I I II I II I I I I I II 
2551 CAT GTAT GT AGCAAT CC GT GAGGAAGT AGCCCACGATAAGAT CACT GC CTT CGAGAAGT G 2610 



Qy 


2581 


Db 


2611 


Qy 


2641 


Db 


2671 


Qy 


2701 


Db 


2731 


Qy 


2761 


Db 


2791 


Qy 


2821 


Db 


2851 


Qy 


2881 


Db 


2911 


Qy 


2941 


Db 


2971 


Qy 


3001 


Db 


3031 


Qy 


3061 


Db 


3091 


Qy 


3121 


Db 


3151 


Qy 


3181 


Db 


3211 


Qy 


3241 


Db 


3271 


Qy 




Db 


3331 


Qy 


3361 


Db 


3391 



CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 264 0 

III I I I I I I I I II I I I I I I II II I II II I I I I I II I I I II I I I II I I I I I 
CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 2 67 0 

TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

III I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGAAGTGGCAGGTGTGGGCATCCAGTGGCACACGTTCAGCCAGTCCCCAGTGGAAGGGGA 2730 

CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 2760 

I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 2790 

CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I 
ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2850 

CTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAG 28 8 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CTTCCCACTACAGAAGTCCTATTGGCTGGGCAGTGGGCGGACAGAGACCTGGGAGTGGAG 2910 

CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 294 0 

I I I I I I I I I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

C T G G C CAT G GGC AC AC G C AC C AC G C CT C AGCGT TAT G GAGGAGGAC C AG GC CT GT GC C AT 2970 

GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I I I I I I I I I I I III I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I 

G GAGAGC C GGCACT T C GAGGAGACT C GC G GT AT GGAGGAG GAG C C CAC C C AC CTGCCTTT 3030 

GGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAA 3060 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I II 
GGTCGTCTGCGTGGACAAGCTCACCAAGGTCTATAAAAATGACAAGAAGCTGGCCTT7\AA 3090 

CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

III II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I M I I 
CAAACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 

GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I I I I I I I II II 
TGGCAAGACCACTACCATGTCTATCCTGACTGGACTGTTCCCACCCACGTCGGGCTCAGC 3210 

CAC CAT C T AC G G G CAC G AC AT C C G CAC G GAG AT G GAT GAG AT C C G C AAG AAC C T G G G CAT 3240 

M I I I II I II I I II I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I 

CACTAT CTAT GGCCACGACAT CCGCACAGAGAT GGAT GAGAT CC GTAAGAAC CTGGGCAT 327 0 

GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGCCCACAGCACAACGTGCTCTTTGACCAGCTCACTGTGGAGGAACACCTCTGGTTCTA 3330 

CT CACGGCTCAAGAGCAT GGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGATGAT CGA 3360 

M I I I I I II II I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 

CT CAC G C CT C AAAAG CAT GG CAC AAGAG GAGAT C C GCAAAGAGAT G GACAAG AT GAT C GA 3390 

GGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGCATGAA 342 0 

I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
GGACCTGGAGCTCTCCAACAAGCGCCACTCGCTGGTACAGACGCTGTCTGGAGGCATGAA 3450 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 3480 

I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I II I I I I I I I IN I II M 
3451 GCGCAAGCTTTCAGTAGCCATTGCCTTCGTGGGTGGCTCTAGAGCCATTATCTTAGATGA 3510 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 354 0 

I II I I I || II I I I I I I I I I I I I M M M I I I M I I I II II I I I I I I I I I I I I I 
3511 GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 3570 

3541 CAAGCCAGGCCGCACCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGG 3600 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I II I II I I I I I I I I II I I II 
3571 CAAGCCGGGTCGCACTATCCTCCTGTCCACCCATCACATGGATGAGGCCGACCTGCTGGG 3630 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
3631 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3690 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTC^GCGGCCCGCCGAGCCGGG 3720 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II 
3691 CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 3780 

I I I I I I I I I I II I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I III 
3751 CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 384 0 

III III I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I MM I I I I I II I I II 
3811 CTCAGAGATGCAAGTGTCCCAGTTCATCCGCAAGCATGTGGCTTCCTCCCTGCTGGTGTC 3870 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

I I I I I I II I I I I I I I I I I I I II I I I I I I I I I II I I I I II I I I I I II I I I I M II 
3871 AGACAC GAG C AC C GAGCT CT C CT AC AT C CT G C C CAGC GAGGC T GT CAAGAAAG G GG C C T T 3930 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

I I I I I I I II II I I I I II I I I I I I II I I I II I I I II II I I I II Mill II II 
3931 CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 

3961 GCT GAT GGACACGACCCT GGAGGAAGT GT T CCT CAAGGT GT CGGAGGAGGAT CAGT CGCT 4020 

I I I I II I I I I I I I I II I I I I I II I I I I I I II II M I II II II M II I II I I II 
3991 GC T GAT G GAC ACAAC CCT GGAGGAGGT GT T C CT CAAG GT GT CT GAAGAAGAC CAGT C ACT 4050 

4021 GGAGAACAGT GAGG C CGAT GT GAAGGAGT C C AGGAAG GAT GTG CT C C CT G GGGC G GAGG G 4 080 

I I I I I I II I I I I I I I II II I I I II I I II I I I II I II II I II I I I I II I I I I M I 
4051 GGAGAAT AGT GAGGC C GAT GT GAAG GAGT C C C G GAAG GAT GC AC T G C CT GG G GCAGAG G G 4110 

4081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

II I M Ml II II I I I I II Mill II II I I II M I M I I I I II I II I I I 

4111 CCTGACGGCTGTGGAGAGTCAAGCAGGCAACCTGGCTCGGTGCTCAGAGCTGGCACAGTC 4170 

4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 00 

I I I I I II I I I II II I II II I I I I I I I I M I I I I I I I I I II II I I I Mill 
4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 4230 

4201 C T AC AC C GAC GT C TAT G G C G ACT AC CGCCCCCTCTTT G AT AAC C C AC AG GAC C C AGAC AA 4260 

I I I II II I I I I III II I II I I I I I I I II I I I I I I I Ml II I II I I I I I I I I 
4231 CT ACAC C GAC G GC T AC G GT GACT AC C GT C C C CT C TTT GACAACT T GC AG GAC C C AGAC AG 42 90 

42 61 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 4320 
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Db 
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Db 
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Db 
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Db 
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Qy 
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Db 
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Qy 


4621 


Db 


4651 


Qy 
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Db 


4711 


Qy 


4741 


Db 


4771 


Qy 


4801 


Db 
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Qy 


4858 


Db 


4891 


Qy 


4918 


Db 


4951 


Qy 


4978 


Db 


5011 


Qy 


5038 


Db 


5071 


Qy 


5098 



I I I I I I I I I I I I I I I! I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 

TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

Ml || Ml I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

M I M I I I I I I I I I I I I I II I I I I I II I I I I II I I I I I I I I I I I I I I I I I I 
CTGTGCTCGCCGGAACTCCAAAGCGCTCTGCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 447 0 

CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

Ml | | I I I I II I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I 
CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4 530 

CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4 560 

I I I I I I Mill I I I I I I I I I II I I I I I I I I I I I II I I II I I I II I I I I I I I I II 
CCTGTCGCCTTCTCAGTACCACAACTATACCCAGCCCCGTGGCAACTTTATCCCCTATGC 4590 

CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4 62 0 

Ml I I M I I I I I I I I I I I I I I I I I I I I I II II II I I I I I I I I I I I I I I I I 

CAAT G AGGAAC GC C G C GAGT AC C GAT T AC GGCT GT C AC CT GAT G C C AG C C C C C AGCAGTT 4650 

CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4680 

I I I I I I I I I I I I I I I II I I II II I I M I I II I I I I I I I I I I I I I I M 

GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I II 
CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 477 0 

TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 800 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I II I I I I I I I I I I I II 
ACGGT T CT T C GACAGT AT GT GC CT G GAGT C CT T CACACAGGG GC T G C CACT GT C CAACTT 4830 

CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA 4 857 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I II I II I I I I I I I I I I I I 
CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 489 0 

CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4917 

MM II I I I I I I I II II II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4 950 

ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4 977 

II II I I I I I I I II II II I I II I I II I I I I I I I I I M I II I I I I I I I I I I I 
GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 

I I I II I I I I I I II I I I II I II I II I I I I I I I I I I I I II I II I I II II II II II 
GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 5070 

C GAC AT C CT GAC CGACAT C AC CGG C CACAAT GT CT CT GAGT AC C T G CT CT T CACC T C C G A 5097 

I II I I I I I II I I I I II I I I II I I I I I I I II I II I I I I I I M I II I II II II I I II 
GGAC AT C C T GACT GAC AT CAC C G GC CACAAT GT T T CC GAGT AC CTGCTCTT CAC CT CT GA 5130 

CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCC 5157 
III I II I I I II I I II I I Mill I I I I I II I M I I I I II III I II I I I I I I I M 
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Qy 
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Db 
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Qy 


5458 


Db 
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Qy 
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Db 
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Qy 
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Db 
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Qy 


5638 


Db 


5671 


Qy 


5698 


Db 


5731 


Qy 


5758 


Db 


5791 


Qy 


5818 


Db 


5851 


Qy 


5878 


Db 


5911 


Qy 


5938 


Db 


5971 



CCGTTTCCGACTGCACCGCTATGGAGCCATCACCTTTGGTAATATCCAGAAGTCCATCCC 5190 

AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M 

AGCACCCATTGGTACCCGGACCCCTCTCATGGTCCGGAAGATTGCAGTGCGGAGGGTGGC 5250 

C C AG GT T T T C T AC AAC AAC AAG G G CT AT C AC AG CAT G C C C AC CT AC C T C AAC AG C C T C AA 5277 
I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CCAGGTGCTCTACAACAACAAGGGCTACCACAGCATGCCCACCTACCTCAACAGCCTCAA 5310 

CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

III I I I I I I I I I I I I I I I I I I I II I I I I I I I II II II 

CAATGCCATTCTGCGTGCAAACCTACCCAAAAGCAAGGGCAATCCAGCAGCCTACGGTAT 537 0 

C AC C GT CAC C AAC CAC C C CAT GAAT AAGAC C AG C G C C AG C CT CT C C CT GGAT T AC C T G CT 5397 

I I I I I I I I I I II II I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I M I I I I I II 

CAC C GT CAC C AAC CAC C C CAT GAAC AAG AC C AGT GCT AGC CTCTCCCTG GAT T AC C TACT 5430 

GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

I I I I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

GCAGGGCACAGACGTGGTCATCGCCATCTTCATCATTGTGGCCATGTCCTTCGTGCCGGC 54 90 

CAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGT 5517 

I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II 

CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 

CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 5577 

MINI II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 

CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 

CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 5 637 

I M I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I III I I I I I II I I I I I I 

CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 5670 

GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

Ml I I I I I I I I I I I I I I II II I II I I I I I I I I I I I I I M I I I I I I I I I I I I I I 

GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 5730 

GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 57 57 

I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I II II I I I I I I I I I I I I I II I I I I I 

ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 5790 

CAT T GT CAT CAAT CT CT T C AT CG GCAT C AC CGC CAC C GT GGC C ACCT T C CT GC T ACAGCT 5817 

Ml I I I I I I I I I I I II I I I I I I I I I I I I I I M I I I I I I II I I I I I I II I I I I I 

CATCGTCATCAACCTCTTCATTGGCATCACGGCCACAGTGGCCACCTTCCTTCTGCAGCT 5850 

CTT CGAG CAC GACAAGGAC CT GAAGGT T GT CAACAGT T AC CT GAAAAG C T GCT T C CT C AT 58 7 7 

IN Mill II I I II II I I I II I I I I I I I II II I II I I I II M M I I I I I M I I I I I I 

CTT T GAGCAT GAC AAG GAT CT GAAG GTT GT CAACAGT TAC CT GAAAAGCT G CT T C C T CAT 5910 

TTTCCCCAACTACAACCTGGGCCACGGGCTCATGGAGATGGCCTACAACGAGTACATCAA 5 937 

I || || I II I II I I II I I I I I II I I II II I II I I I I I I I I I I I I I I I I I II I I I I I I 
C TT C C C CAAC T AC AAC CT GGG C CAC G GACT CAT GGAGAT AG C CT ACAAC GAAT AC AT CAA 5970 

C GAG TAC TAC G C C AAG AT T G G C C AG T T T GAC AAG AT GAAG TCCCCGTTC G AGT G G GAC AT 5997 

M I II I II II I I II II I II I I I II I I II I I M I I I I I M I II I I I I II II I I II I I 

C GAAT AC TAT GC CAAGAT C GG C C AGT T T GACAAGAT GAAGT CCCCGTTT GAGT GGGAC AT 6030 



Qy 


5998 


TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 
,,,,,, , , i , i i i i i i i i i ii i i i i i i i i i i i i i iii i ii i i i i i 

| I I I I I || 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II MINI 1 1 1 II II III 1 II II 1 1 1 

TGTCACACGTGGACTGGTGGCCATGACAGTCGAGGGCTTCGTGGGATTCTTTCTCACCAT 


6057 


Db 


6031 


6090 


Qy 


6058 


CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 

. . . . i i t i i i i i i i i i i i i i t i i i i < i i i i i i t i i i i i ii i i i i i 

| | | I | I || || I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 II II M 1 1 1 1 1 

CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTA7VACCTGT 


6117 


Db 


6091 


6150 


Qy 


6118 


G GAGGAT GAT GT GG AC GT G G C CAGT GAG C G GCAG CGAGT G CT C C GGG GAGAC GC C GAC AA 

. . . , ■ i i i i i i i i i i i i i i i i i i i i i i i i i i i i i ii ii ii i i i i i 

Ml || | I M 1 II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II M II 1 1 1 1 1 

GGAAGAC GAT GTAGACGTGGC CAGT GAG CGGCAAAGAGTGCTCCGTGGC GAT GCTGACAA 


6177 


Db 


6151 


6210 


Qy 


6178 


T GACAT G GT CAAGAT T GAGAAC CT GAC C AAGGT CTACAAGT C C C G GAAGAT T GGC CGT AT 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 M 
T GAC AT GGT CAAGAT C GAGAAC C T GAC T AAGGT GT AC AAGT CT C GGAAGAT C GGC C G CAT 


6237 


Db 


6211 


6270 


Qy 


6238 


CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 

1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II MI'MM 1 1 1 1 1 1 1 1 II 
CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 


6297 


Db 


6271 


6330 


Qy 


6298 


CGT CAAC GGT G C GGGCAAGAC CAGCAC C T T CAAGAT GCT GAC CGGC GAC GAGAGC AC GAC 
M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 II II 
GGT CAATGGTGCCGGGAAGACCAGCACCTT CAAGAT GTTGACTGGAGAT GAGAGCACAAC 


6357 


Db 


6331 


6390 


Qy 


6358 


GGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCA 

* i i i i i i i i i i i i i i i i i i i I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AGGGGGCGAGGCCTTTGTCAATGGACACAGTGTGCTCAAGGACCTGCTCCAGGTTCAGCA 


6417 


Db 


6391 


6450 


Qy 


6418 


GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 

1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Mill 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II II 
GAGCCTTGGCTACTGCCCACAGTTCGACGCCCTGTTCGATGAGCTCACGGCTCGCGAACA 


6477 


Db 


6451 


6510 


Qy 


6478 


CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 

1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 II II II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CCTGCAGCTGTATACTCGGCTTCGAGGCATCCCCTGGAAGGATGAGGCGCAGGTGGTGAG 


6537 


Db 


6511 


6570 


Qy 


6538 


GTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAG 

M I M I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II II 1 1 1 1 1 1 1 
GT GGG C C CT GG AGAAGCT GGAG CT GAC GAAGTGTGCAGACAAGCCAGCC GGT AGCT AC AG 


6597 


Db 


6571 


6630 


Qy 


6598 


CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 

, , . . . , , i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 

II 1 II 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 


6657 


Db 


6631 


6690 


Qy 


6658 


CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 

iii ii i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i i 
I M II 1 1 1 1 M 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 


6717 


Db 


6691 


6750 


Qy 


6718 


CAT C CT C GAC CT CAT CAAGACAGGGC GT T CAGT GGT GC T GACAT CAC ACAGC AT G GAG GA 
Ml || | M 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 
CATT CT GGACCTCAT CAAGACAGGAC GT T CAGT GGT GCT GAC CT CACACAGC AT GGAGGA 


6777 


Db 


6751 


6810 


Qy 

Db 


6778 
6811 


GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 

| | | | I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 1 1 II II Mill II 1 1 1 M 1 

ATGCGAGGCTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 


6837 
6870 



Qy 6838 CAGCATC CAGCACCTGAAGAACCGGT TT GGAGAT GGCT ACAT GAT CACGGT GC GGACCAA 6897 

|| M I I I I I I ! 1 i I II II I I I I I I I -I II I I I I I I I I I I I I I I II I I II I I I 
Db 6871 G AGT AT C C AGC AC C T C AAGAAC AG GT T T G G G GAC GGC T AC AT GAT CAC T GT AAGGAC C AA 6930 

Qy 6898 GAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCAT 6957 

| I I I II I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 6931 AAGCAGCCAGAACGTGAAGGATGTGGTGCGGTTCTTCAACCGGAACTTCCCAGAGGCCAT 6990 

Qy 6958 GCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCT 7017 

| | I M I I I I II I I M I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 6991 GCT CAAGGAAC GC CAC CAT AC GAAGGT GCAGT AT C AGC T CAAGT C GGAG C ACAT C T C GCT 7050 

Qy 7018 GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 7077 

III I I I I I I I I I I I I I I I I I I I I I I I III II II II I I I I I I I I 

Db 7 051 GGCTCAGGTGTTCAGCAAGATGGAGCACGTGGTCGGTGTACTGGGCATCGAGGACTACTC 7110 

Qy 7078 G GT CAGC CAGAC C ACACT GGACAAT GT GTT CGT GAACT T T GC CAAGAAGC AGAGT GACAA 7137 

| I I I I I I I I I I I I I I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7111 AGT CAGC C AGACC AC T C T G GAT AAC GT GT T T GT GAACT T C GC CAAGAAGCAAAGT GACAA 717 0 

Qy 7138 CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 7197 

I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I Ml 
Db 7171 T GT G GAG C AGC AAGAG GCT GA GCCATCCACCTTGCCGTCCCCCCTTG GACTACT 7224 

Qy 7198 CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 7257 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 7225 TAGCCTGCTGCGGCCCCGCCCTGCACCCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 7284 

Qy 7258 C GAGGAC CT GGACAC GGAGGAC GAGGGCCT CATCAGCTTC GAGGAGGAGC GGGCC CAGCT 7317 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I 
Db 72 8 5 TGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAAGAGCGGGCCCAGCT 734 4 

Qy 7318 GTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTC 7377 

M II I I I I I I I II I I I I I I I I I I I I I Mill I II I I I I 

Db 7345 C T C C T T CAAC AC C GAT AC G CT CT GCT GAC GTT C AAGAGT CAC AT C AG GGAT G 7396 

Qy 737 8 C ACT GAC CAC C C AGAGCT GGGC C AGG GACT CAACAAT G GGGAC AGAAGT C C C C CAGT GC C 74 37 

III II M I I I I I I II I 

Db 7397 CAGCTGTTTGGGGCAGAAGTCAGGCGGTGGCCGTAGCCCCAGTCACACA 7445 

Qy 7438 TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 74 96 

I I I I I I I I II I I I I I I I I I M I I I I I I 1 I I I I I I I I I I 
Db 7446 TGCCAGGCCCTGGAAAGGCAGGTTCAGGACCAAAGGGCTCCCGCCCTCC 74 94 

Qy 7497 CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCG 7556 

I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7495 TCCCAACTACCATCCTCCCCGATCGTGCCAAAGGCTGGGCTG 7536 

Qy 7557 GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7615 

I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 7 537 GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGTCCTGGCCCAGC 7596 

Qy 7616 CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 7673 

II I I I I I II I I I I I I I I til II 111 I I I I I I I I I I I 

Db 7597 CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 7656 

Qy 7674 GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 7733 



Db 


7657 


TGTGACCCTTCTCTGCAGCGGCCACCAGTCTACCCAGGCCAGCATCTTGCACAGATGTCT 


7716 


Qy 


7734 


GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 
i it i iii i ii i i i iii i i ii i i i i i i i i i i i i iii 

I || MM 1 M 1 MINI 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 

TTCATGAAAAGACTGCAGTTGGGGAGGTGGCAGCTTGCCTACTTATTTTGCTTTAAGA — 


7792 


Db 


7717 


7774 


Qy 


7793 


AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 
■ ■■I iii ii ii i i i i iii i i i i i i i i i i i 

1 1 1 1 1 1 1 II II 1 1 1 1 IN 1 1 1 1 1 1 1 1 1 1 1 

GCCTCCCTCACTCTGCTGTTGTGAAGAAGTTAGGCTACCATGGGAAGCCATGAATG 


7852 


Db 


7775 


7830 


Qy 


7853 


TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 

■ ■1 ii i i i i i i i i i i i i i i i i i i i i i i i i i i i iii 
Ml || I M I I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGCTAGGTG 


7905 


Db 


7831 


7890 


Qy 


7906 


AGGGGCCA GACCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 

i iii i ii i i i i i i i i i i i i i i i i i i I I I l I I I I 

I I I I I I I I 1 II 1 1 1! 1 1 1 M 1 II 1 1 1 II 1 1 1 1 1 1 1 1 M 1 1 1 

AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 


7960 


Db 


7891 


7949 


Qy 


7961 


CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 

M II II Ml M M 1 1 II 1 1 M 1 1 1 1 II 1 II M 1 1 II II 1 1 

-CCCTTCCTGC CAC C CAT GT GGGAGT AGGAC C T T GT AT AT AG CACAC AGAT GTT T GT T T T 


8020 


Db 


7950 


8008 


Qy 


8021 


AAAT AAAT AAAC AAAAT G 8038 

II 1 II M 1 1 Mill 1 

CAATAAATAAGCAAAAAG 8 02 6 




Db 


8009 





RESULT 11 
US-10-191-803-169 

Sequence 169, Application US/10191803 
Publication No. US2004 0014040A1 
GENERAL INFORMATION: 
APPLICANT: MENDRICK, Donna 
APPLICANT: PORTER, Mark 
APPLICANT: JOHNSON, Kory 
APPLICANT: HIGGS, Brandon 
APPLICANT: CASTLE, Arthur 
APPLICANT: ELASHOFF, Michael 

TITLE OF INVENTION: Cardiotoxin Molecular Toxicology Modeling 
FILE REFERENCE: 44921-5090US 
CURRENT APPLICATION NUMBER: US/10/191,803 
CURRENT FILING DATE: 2002-07-10 
PRIOR APPLICATION NUMBER: US 60/303,819 
PRIOR FILING DATE: 2001-07-10 
PRIOR APPLICATION NUMBER: US 60/305,623 
PRIOR FILING DATE: 2001-07-17 
PRIOR APPLICATION NUMBER: US 60/369,351 
PRIOR FILING DATE: 2002-04-03 
PRIOR APPLICATION NUMBER: US 60/377,611 
PRIOR FILING DATE: 2002-05-06 
NUMBER OF SEQ ID NOS : 1140 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 169 
LENGTH: 804 0 
TYPE: DNA 

ORGANISM: Rattus norvegicus 



FEATURE : 

; OTHER INFORMATION: Genbank Accession No. US20040014040A1 NM_024396 
US-10-191-803-169 

Query Match 72.3%; Score 5810; DB 16; Length 8040; 

Best Local Similarity 84.0%; Pred. No. 0; 

Matches 6768; Conservative 0; Mismatches 1205; Indels 85; Gaps 15; 
Qy 1 CCGCGGCGCTGAGGCGGCGGAGCGTGGCCCCGCCATGGGCTTCCTGCACCAGCTGCAGCT 60 

I I I I I I I II I II MM I I II I II M II II II I II I II M II I I I I 

Db 34 CCGCGGCGCTGAGGCGGCGGAGCGCGGCCCGGCCATGGGCTTCCTGCACCAGCTGCAGCT 93 

Qy 61 GCTGCTCTGGAAGAACGTGACGCTCAAACGCCGGAGCCCGTGGGTCCTGGCCTTCGAGAT 120 

I I I I I I I I I II II I I I I II I I I M I I I M I I I I I I II I I I I I M I I II I 

Db 94 GCTGCTCTGGAAGAACGTGACGCTGAAGCGCCGGAGCCCGTGGGTCCTGGCGTTTGAGAT 153 

Q y 121 CTTCATCCCCCTGGTGCTGTTCTTTATCCTGCTGGGGCTGCGACAGAAGAAGCCCACCAT 18 0 

I || | || || || II II II II II I II I I I I I I M I I M I I I I I I I I I I M M M I I 
Db 154 CTTCATCCCCCTTGTCCTCTTCTTCATCCTGTTGGGACTGCGGCAGAAGAAGCCCACCAT 213 

Qy 181 CTCCGTGAAGGAAGTCCCCTTCTACACAGCGGCGCCCCTGACGTCTGCCGGCATCCTGCC 2 40 

Ml I M I I I I I I I I I I M M M Mill II I I I I I I I I I I I I M 

Db 214 CTCTGTGAAGGAAG— CTTTCTACACGGCAGCACCGCTGACATCGGCCGGCATCCTGCC 270 

Qy 241 TGTCATGCAATCGCTGTGCCCGGACGGCCAGCGAGACGAGTTCGGCTTCCTGCAGTACGC 3 00 

| | I I I I I I I I II II M II I I I I I I II Mill I I I I I I I I 

Db 271 TGTCATGCAGTCGCTTTGCCCTGATGGCCAGCGTGATGAGTTTGGCTTCCTGCAGTATGC 330 

Q y 301 CAACTCCACGGTCACGCAGCTGCTTGAGCGCCTGGACCGCGTGGTGGAGGAAGGCAACCT 360 

I I I I I I I I II II I I I I I II I M I I M I I I I I I I I I I I II I I I I 

Db 331 CAACT C CAC G GT C AC C C AG CT T CT GGAAC G C CT CAAC C GT GT AGT GGAAGAGAG C AACT T 3 90 

Qy 361 GTTTGACCCAGCGCGGCCCAGCCTGGGCTCAGAGCTCGAGGCCCTACGCCAGCATCTGGA 42 0 

| | | I I I I I I I I III II I I I II I II I I II I II I I II I I I M I Ml I MUM 
Db 391 GT T T GAC C C AGAG C GAC CT AGC CT G G GCT C AGAGCT T GAG G C ACT GC AC CAAC GT CT GGA 450 

Qy 421 GGCCCTCAGTGCGGGCCCGGGCACCTCGGGGAGCCACCTGGACAGATCCACAGTGTCTTC 480 

| | | | | I I I I I I II I I I I I I M I I I I M I I I I I I M I I I M I I I II 
Db 451 GGCCCTCAGCTCGGGCCCTGGCACCTGGGAGAGCCACTCAGCTAGACCTGCAGTTTCATC 510 

Qy 4 81 CTTCTCTCTGGACTCGGTGGCCAGAAACCCGCAGGAGCTCTGGCGTTTCCTGACGCAAAA 54 0 

I I I I I I II II I I II I M I I I I I M II Mill II M I I M I M 

Db 511 CTTCTCTCTGGACTCGGTGGCCAGGGACAAAAGAGAGCTTTGGCGTTTCCTGATGCAGAA 57 0 

Qy 541 CTTGTCGCTGCCCAATAGCACGGCCCAAGCACTCTTGGCCGCCCGTGTGGACCCGCCCGA 600 

| | | | | || || | M I I I I II I II II I II III I II I I I I I II I I Mill I M 
Db 571 CCTGTCACTGCCCAACAGCACGGCCCAGGCCCTCCTGGCTGCCCGTGTAGACCCTTCTGA 630 

Qy 601 GGTCTACCACCTGCTCTTTGGTCCCTCATCTGCCCTGGATTCACAGTCTGGCCTCCACAA 660 

M | || I I I I II I II I II I II I I II I 1 1 I I M I I I I I II I M I I 

Db 631 GGTCTATCGCTTGCTTTTTGGTCCTTTACCTGACCTGGATGGAAAGTTGGGGTTCCTCAG 690 

Qy 661 GGGTCAGGAGCCCTGGAGCCGCCTAGGGGGCAATCCCCTGTTCCGGATGGAGGAGCTGCT 72 0 

| I II I II II I II II I I I II I I I I M I I I I M I M I M I I I M I 

Db 691 GAAG CAG GAGC C C T GGAGT CAC C T GG GT AG C AAT CCTCTGTTC CAAAT G GAG GAG CT GCT 750 



Qy 



721 GCTGGCTCCTGCCCTCCTGGAGCAGCTCACCTGCACGCCGGGCTCGGGGGAGCTGGGCCG 7 80 



Db 


751 


Qy 


781 


Db 


811 


Qy 


841 


Db 


871 


Qy 


901 


Db 


931 


Qy 


961 


Db 


991 


Qy 


1021 


Db 


1051 


Qy 


1081 


Db 


1111 


Qy 


1141 


Db 


1171 


Qy 


1201 


Db 


1231 


Qy 


1261 


Db 


1291 


Qy 


1321 


Db 


1351 


Qy 


1381 


Db 


1411 


Qy 


1441 


Db 


1471 


Qy 


1501 


Db 


1531 


Qy 


1561 



1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II I II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 

rrrrrr.rrprPTcrrrTTTTrr.Ar^.AAr.TCACATGTGCTCCAGGCTCTGGGGAGCTGGGCCG 810 



I I I I | I I I I I I I II I I I I I I M I I I I I M I I I I I II I I I M I I t I I I I I I 

GATTCTTACCATGCCTGAGGGTCATCAGGTAGACCTTCAGGGCTACCGGGATGCTGTCTG 870 

CAGTGGGCAGGCTGCTGCGCGTGCCAGGCGCTTCTCTGGGCTGTCTGCTGAGCTCCGGAA 90 0 

| I I I I I I I I II II II II I II M I II I I I I I I I I I I I 

CAGCGGGCAGGCTACAGCTCGTGCCCAGCATTTCAGTGATCTAGCCACTGAGCTCCGGAA 930 

CCAGCTGGACGTGGCCAAGGTCTCCCAGCAGCTGGGCCTGGATGCCCCCAACGGCTCGGA 960 

M | | | M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
CCAGCTGGACATAGCCAAGATTGCCCAGCAGCTGGGCTTCAATGTCCCCAACGGCTCAGA 990 

CTCCTCGCCACAGGCGCCACCCCCACGGAGGCTGCAGGCGCTTCTGGGGGACCTGCTGGA 1020 

| 111 I I I I t II MINI III I I I I I I I I I I I I I I I 

T CCAC AGC C G C AGGCAC C GT C C CCAC AGAGT C T GCAG GCACT CT T AGG G GAC C T G C T G GA 1050 

TGCCCAGAAGGTTCTGCAGGATGTGGATGTCCTGTCGGCCCTGGCCCTGCTACTGCCCCA 1080 

|| I I II I I I I I I I I I I II I I I I I I I I I I I I I II IMM I I I I I I I I I I I I I II 
TGTCCAGAAGGTTCTACAGGATGTGGATGTCCTATCAGCCCTTGCCCTGCTGCTGCCTCA 1110 

GGGTGCCTGCACTGGCCGGACCCCCGGACCCCCAGCCAGTGGTGCGGGTGGGGCGGCCAA 1140 

I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I II 
AGGTGCCTGTGCTGGCCGGGCCCCCGCACCTCAAGCTGGCAGCCCGAGTGGCCCGGCCAA 1170 

TGGCACTGGGGCAGGGGCAGTCATGGGCCCCAACGCCACCGCTGAGGAGGGCGCACCCTC 1200 

M II I I I I I I I I I I II 

C AG C AC C GG GGT AG GG G CAAAT AC AG GT C C C AACACC AC C GT T GAG GAG GGC ACC CAGT C 12 3 0 

TGCTGCAGCACTGGCCACCCCGGACACGCTGCAGGGCCAGTGCTCAGCCTTCGTACAGCT 1260 

| | I || I I I I I I I I I I I I I I I M M I I I I I I M M I I I I I I I 

ACCTGTCACCCCAGCCTCTCCGGACACTCTGCAAGGCCAGTGCTCAGCCTTTGTGCAGCT 1290 

CTGGGCCGGCCTGCAGCCCATCTTGTGTGGCAACAACCGCACCATTGAACCCGAGGCGCT 132 0 

| M I I I III I I I I I I I I I I I I I I I I I I I I I I I I I I I I N II M M 

CTGGGCTGGCTTGCAGCCCATCTTGTGTGGCAACAACCGTACCATTGAGCCTGAAGCACT 1350 

GCGGCGGGGCAACATGAGCTCCCTGGGCTTCACGAGCAAGGAGCAGCGGAACCTGGGCCT 1380 

Ml | I I I I I I I I I II I I I I II I I I I I I I I I I M I I II II I I I I I I I I I I I I II 
CCGGAGGGGCAACATGAGCTCACTGGGCTTTACGAGCAAAGAACAACGGAACCTGGGCCT 1410 

CCTCGTGCACCTCATGACCAGCAACCCCAAAATCCTGTACGCGCCTGCGGGCTCTGAGGT 1440 

|| | | I I I I I I I I I I M I I I I I I M I I I I I II I II I I I II M II I I I I I I I I I 
TCTTGTGCACCTCATGACCAGCAACCCCAAAATCCTGTATGCACCCGCAGGCTCTGAAGC 1470 

C GAC C GC GT CAT C C T C AAG GC CAAC GAGACT T TTGCTTTTGTGGG C AAC GT GACT C ACT A 1500 

| | | I M I I I I I I I II I I II III M I I I I I I I I II I I I I I II I I I I I 

T GAC CAT GT T AT CC T CAAG GCAAAT GAGAC CTTTGCCTTTGT GGGC AAC GT GAC GCACT A 1530 

TGCCCAGGTCTGGCTCAACATCTCGGCGGAGATCCGCAGCTTCCTGGAGCAGGGCAGGCT 1560 

|| I M I I I I I I I I I I I I I III M I I I I I I I I I I I 

C GC C C AG GT CT G GC T CAACAT CT C C G C AGAGAT C C G GAG CT T C CT GGAGC AG G GC AG GCT 1590 

GCAGCAACACCTGCGCTGGCTGCAGCAGTATGTAGCAGAGCTGCGGCTGCACCCCGAGGC 1620 
| | I I I I || I I I I I I I I I II I I I I I I M II II II M I I I I I I I I I I M II 



1591 GCAGCAGCATCTGCACTGGCTGCAGCAGTACGTGGCTGACCTCCGGCTACACCCTGAAGC 1650 

1621 ACTGAACCTGTCACTGGATGAGCTGCCGCCGGCCCTGAGACAGGACAACTTCTCGCTGCC 168 0 

| I I I I I I I I I I I I I I I I I I I I I M I II II III I I MM I I I I II I I I I I 
1651 AATGAACCTGTCACTGGACGAGCTGCCCCCTGCTCTGCGCCTGGACTACTTTTCTCTGCC 1710 

1681 CAGTGGCATGGCCCTCCTGCAGCAGCTGGATACCATTGACAACGCGGCCTGCGGCTGGAT 1740 

|| Mill Mill I M I II I II II II II II II II I I I I I I M I I I 

1711 C AAT G GCAC AG CC CT T CT GC AG CAGCT AG AC AC AAT AGACAAT G C AGC CT GT G G C T GGAT 177 0 

17 41 C C AGT T CAT GT C C AAGGT G AGC GT G GAC AT C T T C AAG GGCTTCCCC GAC GAGGAGAG CAT 18 00 

| || | | | | | | | | I I II II I II I I II I M M I I I M I I M M M II I II I I I I I I I I 
1771 CCAGTT CAT GT CCAAGGT GAGT GT GGACAT CTT CAAGGGGTT T CCT GAT GAG GAG AGC AT 1830 

18 01 T GT CAACT ACACC CT C AACCAGGC CTACCAGGACAAC GT CACT GTTTTT GCCAGT GT GAT 18 60 

|| || || || || I I I I I I I I I II I I II I I I II I I II M M M I M M I I M I I 
18 31 CGT GAACT AC ACT CT CAAT C AG GC CT AC C AG GAC AAT GT T AC AGT ATT T G C C AGC GT GAT 18 90 

1861 CTTCCAGACCCGGAAGGACGGCTCGCTCCCGCCTCACGTGCACTACAAGATCCGCCAGAA 192 0 

I I I I I I I I I I I II II I M II I I I I I M M M M M I I II M II 

1891 T T T C C AGAC AC GGAAGGAT GGTTCCCTCCCCC C ACAT GT C CAT T ACAAG AT T C GC CAGAA 1950 

1921 CTCCAGCTTCACCGAGAAAACCAACGAGATCCGCCGCGCCTACTGGCGGCCTGGGCCCAA 198 0 

Ml | || || I || I II I I II I I I I I I I I I II II I II II II I I I II I II I I I I I I I I 
1951 CT CAAGCT T CAC C GAGAAAAC CAAC GAGAT C C GT C GT GCTT ACT GG C GT C C AGG G C C CAA 2010 

1981 TACTGGCGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCG 2040 

| || I I II I I I II I I I I I I I I I I II M II I Mill M M 

2 011 CACTGGTGGCCGCTTCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATAGAACG 2070 

2 041 CGCCATCATCGACACTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGAT 2100 

I I I M M II II II II II I II II II I I I I II II I II M MM I I I II II I II I I 

2071 T GC C AT CAT CAAC AC GT TTGTGGGG CAC GAC GT GGT C GAAC C C GGC AACT AC GT GCAGAT 2130 

2101 GT T C C C CT AC C C C T G CT AC AC AC GC G AT GACT T C CT GT T T GT CAT T GAGC AC AT GAT G C C 2160 

| | I I I I || I II II II I II M I M II I II M M I M I I II II I I 

2131 GT T C CC GT AC C C C T GCT AC AC C C GT GAC GACT T C CT GT T T GT CATT GAG CAC AT GAT GC C 2190 

2161 GCTGTGCATGGTGATCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGC 2220 

| | | | | || II II I II I M I II I I I II I M II II M I M M II II I 

2191 ACT GT GCAT GGT GAT CT CCT GGGTTT ACT CT GT GGCC AT GACCAT ACAGCACAT CGT GGC 2250 

2221 G GAG AAG GAG CAC C G G C T C AAG GAG G T GAT G AAG AC CAT G G G C C T G AAC AAC G C G GT G C A 2280 

MM, M II I II II I MM II II II I I III M II II II I II 

2251 GGAGAAAGAG CAT C GG CT AAAG GAG GT GAT GAAGAC GAT GGGC CT GAACAAC GC C GT G C A 2310 

2281 CTGGGTGGCCTGGTTCATCACCGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCACTCAC 2340 

| | | I I I Mill M I II II II II II I II Ml M M 

2311 CTGGGTGGCCTGGTTCATCACGGGCTTTGTGCAGCTGTCCATCTCCGTGACAGCCCTGAC 2370 

2341 CGCCATCCTGAAGTACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTT 2400 

| | | | I I M I M II I I I I I I I II I I II II M M 

2371 CGCCATCCTCAAGTATGGCCAGGTCCTCATGCACAGCCACGTGCTCATCATATGGCTCTT 2430 

2401 CCTGGCAGTCTACGCGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 60 

Ml II Mill II M I I I M I I M II I II II I II II II II I I I M II II II 

2431 CCTTGCTGTCTATGCTGTGGCCACTATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTC 24 90 



2461 CAAGGCCAAGCTGGCCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTA 2520 

I | I I I | I Mill II M II I I I I I Mill 

2491 TAAGGCCAAGTTGGCCTCGGCCTGCGGCGGCATCATCTACTTCCTGAGCTACGTTCCCTA 2550 

2521 CAT GTAC GT GGCGAT CC GAGAGGAGGT GGC G CAT GAT AAGAT CAC GGC CTT CGAGAAGT G 2580 

| | | | | | || || | | I I I Mill II I I M M Ml I''' 

2551 CAT GT AT GT AGCAAT C C GT GAG GAAGT AGC C CAC GAT AAGAT CACT G C CT T C G AGAAGT G 2610 

2581 CATCGCGTCCCTCATGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTA 2 64 0 

Ml I II II II I II I I Mill II Mill I I I I I M Mill 

2611 CATTGCGTCCCTGATGTCCACAACAGCCTTCGGCCTGGGTTCCAAGTACTTTGCTCTGTA 2670 

2641 TGAGGTGGCCGGCGTGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGA 2700 

Ml Mill II Mill I II II I II I I I I I N I I 

2671 TGAAGTGGCAGGTGTGGGCATCCAGTGGCACACGTTCAGCCAGTCCCCAGTGGAAGGGGA 2730 

2701 CGACTTCAACTTGCTCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCAT 27 60 

| | | | | || I I M II II I I I I I M II I I I I I I I I M I M I M I II II I I I II I II I 
2731 TGACTTCAACCTGCTCCTTGCTGTCACCATGCTGATGGTGGACACAGTGGTCTATGGCGT 2790 

2761 CCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTA 2820 

|| M I III I M II I M II I II II I I I I M I II II I MM 

2791 ACTCACTTGGTACATTGAGGCTGTGCACCCAGGTATGTATGGGCTGCCCCGGCCCTGGTA 2 850 

2821 CT T C C CACT GC AGAAGT C CT ACT G GCT GGGCAGT GGG C GGACAGAAGC CT GGGAGT G GAG 28 8 0 

| | | || | I I I II I II M II I I II II I I II I I M M I M M M II II M I M I 

2851 CT T C C CACT AC AGAAGT C CT AT T G G CT GGGCAGT GGG C G GAC AGAGAC CT GG GAGT G GAG 2910 

28 81 CTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCAT 294 0 

| | | | | | | | | | II I I I II II II II I I II I M M I M I II I I II M M II I II II 
2911 C T GG C CAT GG GC AC ACGC AC C AC GC CT C AG CGT TAT GGAGGAGGAC C AG G C C T GT GC CAT 297 0 

2941 GGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCT 3000 

I || M I II I M III I II Mill IMIIIIIII I 

2971 G GAGAG CC GG CACT T C GAG GAGAC T C GC GGT AT GGAGGAGGAGCC CAC C CAC CT GC CT T T 3030 
3001 G GT T GT CT GC GT GGACAAACT C AC C AAG GT CT ACAAGGACGACAAGAAG CT GGC CCT GAA 3060 

Ml I Mill I I M I II M I M I M I I II I I M 

3031 GGTCGTCTGCGTGGACAAGCTCACCAAGGTCTATAAAAATGACAAGAAGCTGGCCTTAAA 3090 
3061 CAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGC 3120 

| | | | | | | || II II II II II II I II I I II I I II M I I III I I II II I II I II M 

3091 CAAACTGAGCCTCAATCTCTACGAGAACCAGGTGGTCTCTTTCCTAGGCCATAACGGGGC 3150 
3121 GGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGC 318 0 

|| II II II II I II M II II I I II M II II I II M II I II II M I I II M M 

3151 TGGCAAGACCACTACCATGTCTATCCTGACTGGACTGTTCCCACCCACGTCGGGCTCAGC 3210 
3181 CAC CAT C T AC GGG CAC GAC AT C C G CAC G GAG AT G GAT GAG AT C C G C AAG AAC C T G G G CAT 3240 

Ml II II I M II II II II II II M I I II II I II II II II II II M II M II II II 

3211 CACTAT CTAT GGC CAC GACAT CCGCACAGAGAT GGAT GAGAT C CGTAAGAACCT GGGCAT 327 0 
3241 GTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTA 3300 

MUM II II II II II II II I II II I I MUM Mill M I I I M II II II 

3271 GTGCCCACAGCACAACGTGCTCTTTGACCAGCTCACTGTGGAGGAACACCTCTGGTTCTA 3330 



3301 CT CACGGCT CAAGAGCAT GGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGATGAT CGA 3360 

| | | | | | | | | | | I I I I I I I I II I I I I I I I I I I II I I I I I I I M I I I I I I M I I I I I 
3331 CT CACGC CT CAAAAGCAT GGCACAAGAGGAGATC CGCAAAGAGAT GGACAAGAT GAT CGA 3390 

3361 G G AC C T G GAG C T C T C C AAC AAAC G G C AC T C AC T G G T G C AG AC AT TGTCGGGTGG CAT G AA 342 0 

| | M | || || I I I II I I I I I II II II II I I I I M I I II I I I I I I I I I I 

3391 GGACCTGGAGCTCTCCAACAAGCGCCACTCGCTGGTACAGACGCTGTCTGGAGGCATGAA 34 50 

3421 GCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGA 34 8 0 

| || || | | || II II I I I I I I I I I I I I I I I I M I II I I Mill IN I M M 
3451 GC G CAAGCT T T C AGT AG C CAT T GC CT T C GT GGGT G GCT CT AGAGC CAT TAT CT T AGAT G A 3510 

34 81 GCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTA 354 0 

| | | | | | || || I I I I I I II II I M M I 

3511 GCCCACAGCTGGCGTGGACCCCTATGCTCGACGTGCCATCTGGGACCTCATTCTGAAGTA 357 0 

3541 C AAGC C AGGC C G C AC CAT CCTTCTGTC C AC C C AC C AC AT GGAT GAG GC T GAC CT G CT T G G 3600 

I I I I I I || I I I I I I I I II I I I I I I I I I II II II I I I I I I I I I I I I I I I I I I M 

3571 CAAGC C GGGT CGCACT AT C CT C CT GT CCACCCAT C ACAT GGAT GAGGC C GACCT GCT GGG 3630 

3601 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCT 3660 

| | | | | | | | | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I M 

3631 GGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAATGCTGCGGCTCTCCCCTCTTCCT 3690 

3661 CAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGG 372 0 

| | | | | | | | | | II I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I M 

3691 CAAGGGTGCCTACGGCGATGGCTACCGCCTCACACTGGTCAAGCGGCCTGCGGAGCCTGG 3750 

3721 GGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTG 37 8 0 

| | | I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I Ml 
3751 CACCTCCCAAGAGCCAGGGATGGCTTCCAGCCCCTCAGGTCGTCCTCAGCTGAGCAACTG 3810 

3781 CTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTC 3840 

Ml Ml I II I I I I I I I I I M I I I I I I I I I I I I I I I II I MM I I I I I I I I I I I 

3811 C T CAGAGAT GCAAGT GT CC CAGT T CAT C C G CAAGC AT GTGGCTTCCTCCCTGCTGGT GT C 3870 

3841 AGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTT 3900 

M | I II Mill II I II I I I I I I I I II I I I II I I M I I I M I I I II I I Mill II 
3871 AGACACGAGCACCGAGCTCTCCTACATCCTGCCCAGCGAGGCTGTCAAGAAAGGGGCCTT 3930 

3901 CGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGCTTCGG 3960 

| I I I II I II I I I II I I I II M I I I II II II II I I M I I I I M Mill M II 
3931 CGAGCGCCTCTTTCAGCAATTGGAGCACAGCCTGGACGCACTGCATCTGAGCAGTTTTGG 3990 

3961 GCT GAT GGACACGAC C CT GGAGGAAGT GT T C CT CAAGGT GT C GGAG GAGGAT CAGT C GC T 4020 

I || I M I II II I II I I I I I II II I I I I I I II I II I I I I M M II I M 

3991 GCT GAT GGAC ACAAC C CT GGAGGAG GT GT T C CT CAAGGT GT C T GAAGAAGAC CAGT C ACT 4050 

4021 GGAGAACAGTGAGGC CGAT GT GAAGGAGTCCAGGAAGGAT GT GCTC CCT GGGGC GGAGGG 4080 

I II I I I I II I I I M II I II I M I II I I II I I M I II II I I I I I I I II II 

4051 GGAGAAT AGT GAG GC C GAT GT GAAG GAGT C C C GGAAG GAT GC ACT G CCT G G G GCAGAGG G 4110 

4 081 CCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTC 414 0 

M I II Ml I II I MM M Mill I II I I II I I I II I II I I I I I Mill 

4111 CCTGACGGCTGTGGAGAGTCAAGCAGGCAACCTGGCTCGGTGCTCAGAGCTGGCACAGTC 417 0 
4141 GCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGG 42 00 



4171 CCAGGCTTCACTGCAGTCTGCATCTTCTGTGGGCTCCGCCCGTGGGGATGAGGGTGCTGG 4230 

4201 C T AC AC C G AC G T C TAT G G C G AC T AC CGCCCCCTCTTT GAT AAC C C AC AG G AC C C AGAC AA 42 60 

I Mill III II I II I I I I I I I I I I I M I I I II I I I I I I I I M I I I I 

4231 CTACACCGACGGCTACGGTGACTACCGTCCCCTCTTTGACAACTTGCAGGACCCAGACAG 4290 

42 61 TGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAA 432 0 

M | | | | | | | | | | | | I II I I I I II I I I I I II I I I I I I M I I M I I I M I 

4291 TGTCAGCTTACAAGAGGCTGAAATGGAGGCCCTGGCTCGGGTAGGCCAGGGCAGCCGCAA 4350 

4321 GCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCA 438 0 

| | | || | | I I I I I I I I II I I MM I II II I I I Mill II I I I M I I I M I M 
4351 GCTAGAGGGCTGGTGGCTGAAGATGCGGCAGTTCCATGGGCTCCTGGTGAAGCGCTTCCA 4410 

4381 CTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGT 444 0 

Ml M I II I I I I I I I I I I M I I I I I M I I I I I I I I I M 

4411 CTGTGCTCGCCGGAACTCCAAAGCGCTCTGCTCCCAGATTCTGCTGCCTGCCTTCTTCGT 4470 

4441 CTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGT 4500 

I I I Ml I Mill MM Mill Mill Mill Mill II II II I 

4471 CTGTGTGGCCATGACTGTGGCATTGTCTGTCCCTGAGATCGGTGACCTGCCTCCACTGGT 4530 

4 501 CCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGC 4560 

IMIM I II I I I I I I I M I I I M M I I I I I I I I I I II I I II I II II I I I I II II 
4531 CCTGTCGCCTTCTCAGTACCACAACTATACCCAGCCCCGTGGCAACTTTATCCCCTATGC 4590 

4 561 CAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCT 4620 

Ml II II II I II II I I I I Mill II II II III I I 

4591 CAATGAGGAACGCCGCGAGTACCGATTACGGCTGTCACCTGATGCCAGCCCCCAGCAGTT 4 650 

4621 CGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGC 4 680 

II II I I II II II I II II I I M I I I II I I II I I M M II I II I II II 

4651 GGTGAGCACATTCCGGCTGCCCTCTGGTGTGGGTGCCACTTGTGTGCTCAAGTCTCCAGC 4710 

4681 CAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGC 474 0 

|| II M I II I I I I I I I I I I M M I I I I I I * 

4711 CAACGGCTCCCTGGGGCCCATGCTGAACTTGAGCAGTGGAGAGTCCCGCCTGCTGGCCGC 477 0 

4741 TCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTT 4 8 00 

I M II II II II I I I Mill II II I I I I I I I I I II I M M II I I I I I II M II M II 

4771 ACGGTTCTTCGACAGTATGTGCCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAACTT 4 830 

4801 CGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGA— 4 857 

| | M II II I II I II I I M I I M M M I II I I I I I M I I M I I I I II II I M 
4831 CGTGCCACCCCCACCCTCGCCCGCCCCTTCCGACTCACCCCTGTCCCCGGATGAGGATTC 4 890 

4858 CCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGC 4917 

MM M II I I I I I I I I II I I I I I I M I II I I II I I I I I I I I 

4 891 ACTGCTAGCCTGGAATACGTCCCTGCCCCCTACTGCTGGACCAGAGACGTGGACGTGGGC 4950 

4918 ACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCAC 4 977 

M M Mill I I I II II I I Mill I M I I II I I II I I II I I II II II M I I 

4 951 GCCTTCTCTGCCACGCCTGGTTCACGAGCCGGTCCGCTGTACCTGCTCTGCACAGGGCAC 5010 

4978 CGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGG 5037 
M II I II I I II I I I M M I I I M I I II II I I I I I I I I M I I I I I I II I 



5011 GGGCTTCTCGTGCCCCAGCAGTGTGGGTGGGCACCCACCCCAGATGAGAGTGGTCACGGG 5070 



5038 
5071 
5098 
5131 
5158 



C GACAT CCTGACCGACAT CACCGGCCACAAT GT CT CT GAGTAC CT GCT CTT CAC CT CCGA 5097 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I M I I I I M I I I I I I I M 

GGACAT C CT GACT GACAT CACCGGCCACAAT GTTT C C GAGTAC CT GCT CTT CAC CT CT GA 5130 
CCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCC 5157 

Ml , I I I I I M I I II I I III MINIMI M Ml MINIMUM 

CCGTTTCCGACTGCACCGCTATGGAGCCATCACCTTTGGTAATATCCAGAAGTCCATCCC 5190 



AGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGC 5217 

| | | | 111 II I I I 1 I I I I I I I I I I I I I I I II 1 I I I I I I I I N 

5191 AGCACCCATTGGTACCCGGACCCCTCTCATGGTCCGGAAGATTGCAGTGCGGAGGGTGGC 5250 

5218 C C AG GT T T T C T AC AAC AAC AAG G G C TAT CAC AG CAT G C C CAC C T AC C T C AAC AG C C T C AA 5277 

MINI II I II II I II II N II I I I I II I I II I I II I II II I II I I I II I I M II I I 
5251 CCAGGTGCTCTACAACAACAAGGGCTACCACAGCATGCCCACCTACCTCAACAGCCTCAA 5310 

5278 CAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCAT 5337 

Ill I I I I I I I I I I I I I INN I I I M I 1 II I I II II II INN II 

5311 CAATGCCATTCTGCGTGCAAACCTACCCAAAAGCAAGGGCAATCCAGCAGCCTACGGTAT 537 0 



5338 CAC C GT CAC CAAC CAC C C CAT GAAT AAGAC C AGC GC C AGC CTCTCCCTG GATT AC CT GCT 

| | | I II I II I I I II I II II III INN II INN I Nl II 

5371 C AC CGT C AC CAAC CAC C C CAT GAACAAGAC C AGT GC T AGCC T C T C CCT G GATT AC CT ACT 



5397 
5430 



5398 GCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGC 5457 

Mill I II II II N II I I I I II N I I II IN I I I I I I I M II I II 

GCAGGGCACAGACGTGGTCATCGCCATCTTCATCATTGTGGCCATGTCCTTCGTGCCGGC 



5431 



5490 



5458 CAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGT 5517 

II I II I III I II II IN N Ill II INN II II INI 

5491 CAGCTTCGTGGTCTTCCTTGTGGCCGAGAAATCCACCAAGGCCAAACACCTGCAGTTCGT 5550 



5518 



5577 



CAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTA 

|| M |l INN NMI II I II II II II I II I II I I I I I 

5551 CAGCGGGTGCAACCCTGTCATCTACTGGCTAGCCAACTACGTGTGGGACATGCTCAATTA 5610 



5578 CCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACAC 

| | | | | | || | || II II I II I II II I I I I II I I II II II II N II I I I 

5 611 CCTGGTCCCGGCCACCTGCTGCATCATCATCCTCTTCGTGTTTGACTTGCCGGCCTACAC 



5637 
5670 



5638 GTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCAC 5697 

|| I II II I II II II I II N N I I N II I I II II I I II II I I I II 1 N II I I ' 
GTCACCCACCAACTTCCCCGCGGTGCTCTCCTTGTTCCTGCTCTATGGATGGTCCATCAC 



5671 



5730 



5698 GCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCT 5757 

I | || || I I II II I I I I II N I I II I II N I I I I I I I I I I II I II I II I I II II I I I 

5731 ACCCATCATGTACCCGGCCTCCTTCTGGTTTGAGGTCCCTAGCTCAGCCTACGTGTTCCT 5790 



5758 CATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCT 

Ml || | | N II I II I I I I I I II I I II I N I I I I II N II II II II I N II I I I 
CAT CGT CAT CAACCT CTT CATTGGCAT CACGGCCACAGTGGCCACCTTCCTT CTGCAGCT 



5791 
5818 
5851 



CT T C GAGC AC G AC AAG G AC C T GAAG GT T GT CAAC AGT T AC CT GAAAAGCT GCT T C CT CAT 
Ml | | | || II I I I I II II I I II II II I I I I I II II I II I I II I I I II II I I I M I I I 
CT T T GAGC AT G AC AAGGAT CT GAAG GT T GT CAAC AGT T AC CT GAAAAG CTGCTTCCT CAT 



5817 
5850 
5877 
5910 



5878 
5911 



T T T C C C CAAC T ACAAC CT GG G C C AC GG G CT CAT G GAG AT G G C C T ACAAC GAGT AC AT C AA 

M I M | I | I I | | I I I I I I I I II II I I I I I I I I I I I I I Mill I I I I M I I 

CTT C C C CAAC T ACAACC T GG G C CAC GGACT CAT G GAGAT AG C C T ACAAC GAAT AC AT C AA 



5938 C GAGT AC T AC GC CAAGAT T G GC C AGT T T GAC AAGAT GAAGT C C CC GT T C GAGT G G GAC AT 

1 1 1 1 1 1 1 1 i M 1 1 1 1 1 i M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 mi 1 1 1 [ILII!!!!!!!!! 

5971 
5998 



C GAAT ACT AT G C CAAGAT C G GC CAGT T T GAC AAGAT GAAGT C C C C GT T T GAGT GGGAC AT 



TGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCAT 

| | | | | | || | | I I I I I I I I I II I I I I I I I I I I I II I I I I I 

6031 TGTCACACGTGGACTGGTGGCCATGACAGTCGAGGGCTTCGTGGGATTCTTTCTCACCAT 



6058 CATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGT 

| | | | | | || || | I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I II Mill 
6091 CATGTGTCAATATAACTTCCTACGGCAGCCACAGCGTCTGCCTGTGTCTACTAAACCTGT 

6118 G GAG GAT GAT GT G GAC GT G G C CAGT GAG C G G C AG C GAGT GCTCCGGG GAG AC G C C G AC AA 
Ml || | | | | | I M I I I I I I I II I M M I I I II I I I II M I M M M II II I 
6151 GGAAGAC GAT GT AGAC GT G GC CAGT GAG C GG C AAAGAGT GCTCCGTGGC GAT GCT GAC AA 



5937 
5970 
5997 
6030 
6057 
6090 
6117 
6150 
6177 
6210 



6178 T GACAT GGT CAAGAT T GAGAACCT GACCAAGGT CTACAAGT CCCGGAAGATT GGCCGTAT 6237 

| | || | || | II M I I I I I I M I M I I II I II I I M II M 

6211 T GACAT GGT CAAGAT C GAGAAC CT GACT AAGGT GT ACAAGT CT CGGAAG AT C G GC C GC AT 6270 



6238 CCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGG 

|| | I I I I II II I I M II I I I I M I I I I Ml I M 

6271 CCTGGCAGTGGACCGCCTTTGCCTGGGTGTGCGCCCCGGAGAGTGCTTTGGGCTCCTCGG 



6298 
6331 
6358 
6391 
6418 



C GT CAAC GGT GC GGGCAAGAC CAGCACCT T CAAGAT G CT GAC C GG C GAC GAGAG CAC GAC 

| | | M Mill M I II I I I I I II M I M II I I II MM M M II I I II II M 

GGT CAAT GGT G C C G GGAAGAC CAG CACCT T CAAGAT GT T GACT GGAGAT GAGAG C ACAAC 

GGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCA 

| | M I I I II II II I M M M II I II I I I I I I I I I 1 

AGGGGGCGAGGCCTTTGTCAATGGACACAGTGTGCTCAAGGACCTGCTCCAGGTTCAGCA 



GAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCA 

II II I II I M I MM I I I M M II I II I II I I I II I M I II I I I I 

64 51 GAGC CT T GG CT ACT GC CC AC AGT T C GAC GC C CT GT T C GAT GAGCT CAC G GCT C G C GAAC A 

647 8 CCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAA 

I | || | || || M I II I M I I I I M I I I I M I M I I I 

6511 C C T G C AG CT GT AT ACT CG GCT T C GAGG C AT CC CCT GGAAG GAT GAGGCG C AG GT GGT GAG 
6538 GTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAG 

I I | | I I I I I I M II MINI I MM MINIMI I I NUN 

6571 GTGGGCCCTGGAGAAGCTGGAGCTGACGAAGTGTGCAGACAAGCCAGCCGGTAGCTACAG 



6297 

6330 

6357 

6390 

6417 

6450 

6477 

6510 

6537 

6570 

6597 

6630 



6598 CGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCAT 6657 

|| MM Ill II II I Ml I I I 1 i 1 I I I I III N N 

6631 TGGGGGCAACAAACGGAAACTTTCCACAGCCATCGCTCTCATTGGGTACCCTGCCTTCAT 6690 
6658 CTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCT 6717 

Ml II I III III MUM MINN I I I I I I I I I I M I I 1 I I INN IN 

6691 CTTTCTAGACGAGCCCACCACTGGCATGGACCCTAAGGCCCGGCGCTTCCTGTGGAACCT 6750 



Qy 


D / lO 


CAT C C T C G AC CT CAT C AAGAC AGG G C GT T C AGT G GT G CT GAC AT C AC AC AG CAT G GAGGA 

IN || I 1 II 1 1 1 1 1 1 1 I 1 1 1 1 1 II 1 1 1 1 II 1 II 1 1 M 1 1 1 1 1 1 1 1 

r a T T r T GG A r r T C A T C AAGAC AGGAC GT T C AGT G GT G C T GACC T C AC AC AGC AT GGAG GA 


6777 




O / Jl 


6810 


Qy 


D / / 0 


GTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGG 

II I 1 1 1 1 1 II II 1 1 M II II 1 HIM 

atg rGAGGrTGTGTGCACACGGCTGGCCATCATGGTGAATGGACGGCTGCGCTGCCTGGG 


6837 


UD 


£ P 1 1 
Doll 


6870 


Qy 


f£ P ^ P 
Do Oo 


C AG CAT C C AG C AC C T GAAGAAC C G GT T T G G AGAT G G C T AC AT GAT C AC G GT G C G GAC C AA 

|| M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 

GAGTATrrAGrArrTC aagaacag GT T T GG GGAC GG CT ACAT GAT CACT GT AAGGACCAA 


6897 


UD 


£P 7 1 
Do / I 


6930 


Qy 


£ P Q P 

d o y o 


GAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCAT 

1 1 1 1 1 M 1 1 1 1 1 1 Ml M 1 

AArr ArrrArAArrTGAAGGATGTGGTGCGGTTCTTCAACCGGAACTTCCCAGAGGCCAT 


6957 


Db 


byoi 


6990 


Qy 


6958 


GCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCT 

I I I I I 1 1 1 1 II 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
r r m r a. n r r a a r r r r A r r A t A r G A A GGT G r A GT AT CAGCT CAAGT C GGAGC ACAT CT CGCT 


7017 


Db 


by y i 


7050 


Qy 

DO 


7018 

i ri r i 
/ UO 1 


GGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTC 

IN 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M III II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

rrrTG ATGTGTTr AGGAAGAT GGAGC AC GT GGT C GGT GT ACT GGGC AT C GAGGACT ACT C 


7077 
7110 


Qy 

Db 


*7 m p 
/ U / o 

/111 


GGTCAGCCAGACCACACTGGACAATGTGTTCGTGAACTTTGCCAAGAAGCAGAGTGACAA 

| I 1 1 1 1 1 1 1 1 1 M M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

arTrnrrr ar arr ArTrTPGATAACGTGTTTGTGAACTTCGCCAAGAAGCAAAGTGACAA 


7137 
7170 


Qy 


/loo 


CCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCT 

I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

rnrTrr i\rri\rr A at ag^PTGA GCCATCCACCTTGCCGTCCCCCCTTG GACTACT 


7197 


Db 


/ 1 / 1 


7224 


Qy 


1 1 Q P 

/ 1 y o 


CAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCC 

I I 1 I 1 I 1 1 MINIM 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 

TiArrrTrrTrrrrrrrrGrrrTGrACrCACAGAGCTCCGGGCACTGGTGGCCGATGAGCC 


7257 


Db 


■7 o o c: 

/zZO 


7284 


Qy 


/ZOO 


CGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCT 

|| II 1 1 II 1 1 1 II II II 1 1 1 II 1 1 1 1 1 1 M M M M 1 M 1 II 1 1 1 1 1 II 1 1 1 II 1 1 1 1 

Tr7\rri\rr'vrr at Arpf^APGArGAGGGrrTCATCAGCTTCGAGGAAGAGCGGGCCCAGCT 


7317 


Db 


n o o r 
/zoo 


7344 


Qy 


/ O 1 o 


rT r rT T r A TV r A r r; r- A r A n gc T CT G CT GAC C AC C C AGAG CT GGGC C AGG GAG GACACG CT C 

1 M II 1 1 II II M II II 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 II M 1 


7377 


Db 


/o4 o 


7396 


Qy 


1 o 1 o 


CACT GAC CACC CAGAGCT G GGCC AGGGACT C AACAAT GGG GAC AGAAGT C C C C CAGT GC C 


7437 


Dd 


/ oy / 


Ml II II 1 1 1 1 1 1 M 1 

CAGCTGTTTGGGGCAGAAGTCAGGCGGTGGCCGTAGCCCCAGTCACACA 


7445 


Qy 


i /i p p 


TGCCAGGGCCTGGAGTGG-AGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTA 
I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 

J_ bLbnbbbbb X ljjkj/\r\r\^jVjv_^.rt\jVj X x ^xt-VJJ o^t.^ ^i\tii\.^j x wv^^v^wv^v^j. ww 


7496 


Db 


/44 b 


7494 


Qy 


7497 


CTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGlGLCAAAOLrUlCjAUUC^ 

Ml I I III I 1 1 1 1 1 1 1 II 1 1 1 1 1 II 


7 S S fi 

1 O O D 


Db 


7495 


7536 


Qy 


7557 


GCCC-GGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 


7615 



I I I I I M I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I Mill I 

Db 7537 GCCCTGGGCTGCACACACCCTCACCCTGCTTTGCCTTAAAGCCTTGGGTCCTGGCCCAGC 7596 

Qy 7616 CCTCGCCCCTGCCTGGCACTGCTCACC-GCCCAAGGCGACGCCGGCTGGACCAGGCA-CT 7673 

|| | | I I I I I II I I I I I I I I I I I M 

Db 7597 CCCTTACCCTGCCCAGCACCATCCACCTTCCCAGGGTGACATGGGCTGCCCCAAGTATCC 7656 

Qy 7674 GCTGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGAT 7733 

I I I I I M Ml III I II N ' 

Db 7657 TGTGACCCTTCTCTGCAGCGGCCACCAGTCTACCCAGGCCAGCATCTTGCACAGATGTCT 7716 

Qy 7734 GCCGAGAGCGGGCTGTGGGCGGAGCTGGGTCAG-TCCCGTATTTATTTTGCTTTGAGAAG 7792 

Ill I I I I I I I I I I I I I I 

Db 7717 TTCATGAAAAGACTGCAGTTGGGGAGGTGGCAGCTTGCCTACTTATTTTGCTTTAAGA— 7774 

Qy 7793 AGGCTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCT 7852 

MM III I I I I I I I i I I I I I I 1 I I 

Db 7775 GCCTCCCTCACTCTGCTGTTGTGAAGAAGTTAGGCTACCATGGGAAGCCATGAATG 7830 

Qy 7 853 TGGGCCAGCTGGCAGG TGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCA 7905 

|M II I M II I II I I I II H I II I I I I I I M I I I I 

Db 7831 TGGCTGCCTCAGCCCTGGTGGAATGGCAGGAACGGAGAAGCTGGGCTTGCTGGCTAGGTG 7 890 

Qy 7906 AGGGGCCA GACCCCCCCC7^ACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGC 7960 

| || | | | | | MM I M II I I II I I I I 

Db 78 91 AGGGGCCACTGCTCCCTCCCTGCCCCCTCAAGCTGCCTTTGCTCTCCCGCTCAGCTTGG- 794 9 

Qy 7961 CCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTT 8020 

| | | | M || | M II I I I I I I I M II I I II M I I I I M M I I 

Db 7950 -CCCTTCCTGC CAC C CAT GT G G G AGT AG GAC CT T GT AT AT AG C AC AC AGAT GTTTGTTTT 8008 

Qy 8021 AAAT AAAT AAACAAAAT G 8038 

I I II II II I Mill I 
Db 8009 CAATAAATAAGCAAAAAG 8 026 



RESULT 12 
US-10-297-022-45 

Sequence 45, Application US/10297022 

Publication No. US20030216310A1 
GENERAL INFORMATION: 

APPLICANT: INCYTE GENOMICS, INC. 

APPLICANT: THORNTON, Michael 

APPLICANT: WALIA, Narinder K. 

APPLICANT: YUE, Henry 

APPLICANT: NGUYEN, Danniel B. 

APPLICANT: LAL, Preeti 

APPLICANT: GANDHI, Ameena R. 

APPLICANT: TRIBOULEY, Catherine M. 

APPLICANT: YAO, Monique G. 

APPLICANT: RAMKUMAR, Jayalaxmi 

APPLICANT: AU-YOUNG, Janice 

APPLICANT: LU, Yan 

APPLICANT: TANG, Y. Tom 

APPLICANT: AZIMZAI, Yalda 

APPLICANT: BRUNS , Christopher M. 

APPLICANT: GRIFFIN, Jennifer A. 



APPLICANT: YANG, Junming 
APPLICANT: BAUGHN, Mariah R. 
APPLICANT: SAN JANWALA , Madhu S. 
APPLICANT: RAUMANN, Brigitte E. 
APPLICANT: LEE, Ernestine A. 
APPLICANT: HAFALIA, April 
APPLICANT: GREENE, Barrie D. 
APPLICANT: KHAN, Farrah A. 
APPLICANT: KEARNEY, Liam 
APPLICANT: ELLIOTT, Vicky S. 
APPLICANT: SEILHAMER, Jeffrey J. 
APPLICANT: POLICKY, Jennifer L. 
APPLICANT: BOROWSKY, Mark L. 
APPLICANT: BURFORD, Neil 
APPLICANT: DING, Li 
APPLICANT: LU, Dyung Aina M. 
APPLICANT: HILLMAN, Jennifer L. 

TITLE OF INVENTION: TRANSPORTERS AND ION CHANNELS 
FILE REFERENCE: PI-0109 PCT 
CURRENT APPLICATION NUMBER: US/ 10/2 97 , 022 
CURRENT FILING DATE: 2002-11-25 

PRIOR APPLICATION NUMBER: 60/208,424; 60/209,001; 60/210,588; 60/212,335; 
60/213,747; 60/215,391 

; PRIOR FILING DATE: 2000-05-26; 2000-06-01; 2000-06-08; 2000-06-16; 2000-06- 
22; 2000-06-29 

NUMBER OF SEQ ID NOS : 54 
SOFTWARE: PERL Program 
SEQ ID NO 45 
LENGTH: 554 0 
TYPE: DNA 

ORGANISM: Homo sapiens 
FEATURE : 

NAME/KEY: misc_f eature 

OTHER INFORMATION: Incyte ID No. US2 00302 1631 0A1 2311751CB1 
US-10-297-022-45 

Query Match 68.9%; Score 5536.8; DB 16; Length 5540; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5538; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 1995 TCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACA 2054 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 1 TCTACTTCCTCTACGGCTTCGTCTGGATCCAGGACATGATGGAGCGCGCCATCATCGACA 60 

Qy 2 055 CTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCT 2114 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 61 CTTTTGTGGGGCACGACGTGGTGGAGCCAGGCAGCTACGTGCAGATGTTCCCCTACCCCT 12 0 

Qy 2115 G CT ACAC AC G C GAT GACT T C C T GT T T GT CATT GAGCAC AT GAT G C C G CT GT GCAT GGT G A 2174 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I M I I I I 11 I I I I I I I 

Db 121 GCT ACAC AC G C GAT GAC TTCCTGTTTGT CAT T GAGCAC AT GAT GCCGCTGTG CAT GGT GA 180 

Qy 2175 TCTCCTGGGTCTACTCCGTGGCCATGACCATCCAGCACATCGTGGCGGAGAAGGAGCACC 2234 

I II I II I I I I I I I I I II II I I I I I I I I I I I I I I I II I I I I I I M I I I M I I I I I I I I I I I 
Db 181 T C T C CT G GGT CT ACT C C GT GGC CAT GAC CAT C C AGC AC AT C GT GG C G GAGAAG GAGCAC C 24 0 



QY 



2235 G G C T C AAG GAG GT GAT G AAG AC CAT G G G C C T G AAC AAC G C G GT G C AC TGGGTGGCCTGGT 22 94 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 i 1 1 1 1 1 1 1 

Db 241 GGCTCAAGGAGGTGATGAAGACCATGGGCCTGAACAACGCGGTGCACTGGGTGGCCTGGT 300 

Qy 2295 T CAT CAC CGGCTTT GT GCAGCT GT C CAT CT C C GT GACAGCACT CAC CGC CAT CCT GAAGT 2354 

I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 301 T CAT CAC CGGCTTT GTG C AGC T GT C CAT CT C C GT G AC AG C ACT CAC CGC CAT CCT GAAGT 360 

Qy 2355 ACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACG 2414 

I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 ACGGCCAGGTGCTTATGCACAGCCACGTGGTCATCATCTGGCTCTTCCTGGCAGTCTACG 420 

Qy 2415 CGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGG 2474 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 421 CGGTGGCCACCATCATGTTCTGCTTCCTGGTGTCTGTGCTGTACTCCAAGGCCAAGCTGG 480 

Qy 2475 CCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGA 2534 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 CCTCGGCCTGCGGTGGCATCATCTACTTCCTGAGCTACGTGCCCTACATGTACGTGGCGA 54 0 

Qy 2535 T C C GAGAGGAGGT G GC G CAT GATAAGAT CAC G GC CT T C GAGAAGT GC AT CGC GT C CCT C A 2594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I 
Db 541 T C C GAGAGGAGGT GG C G CAT GATAAGAT CAC G GC CT T C GAGAAGT GCAT CGCGTCCCT C A 600 

Qy 2595 TGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCG 2654 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 TGTCCACGACGGCCTTTGGTCTGGGCTCTAAGTACTTCGCGCTGTATGAGGTGGCCGGCG 660 

Qy 2655 TGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGC 2714 

I I I I I I I I I I I I I I II I I I I I I I II I I I I 1 I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 661 TGGGCATCCAGTGGCACACCTTCAGCCAGTCCCCGGTGGAGGGGGACGACTTCAACTTGC 72 0 

Qy 2715 TCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACA 2774 

I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I 
Db 721 TCCTGGCTGTCACCATGCTGATGGTGGACGCCGTGGTCTATGGCATCCTCACGTGGTACA 780 

Qy 2775 TTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGA 2834 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I II I I I I I I I I I I 
Db 781 TTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCCTGGTACTTCCCACTGCAGA 84 0 

Qy 2835 AGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCAC 2894 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 841 AGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAGTGGAGCTGGCCGTGGGCAC 90 0 

Qy 2 8 95 GCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCT 2954 

I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 901 GCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGTGCCATGGAGAGCCGGCGCT 960 

Qy 2955 TTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGG 3014 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I II I I I I I 
Db 961 TTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTGCCTCTGGTTGTCTGCGTGG 1020 

Qy 3015 ACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCCCTGAACAAGCTGAGCCTGA 3074 

I I M I I I I I I I I || II I I I I I I I II I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I 
Db 1021 AC AAACT C ACCAAGGT C T ACAAG GAC GACAAGAAGC T G GC C CT GAACAAG CT GAGCCT G A 1080 



Qy 



3075 ACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCA 3134 
I I I I I I I I I I I I I II II I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1081 ACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAACGGGGCGGGCAAGACCACCA 1140 

3135 CCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGC 3194 

I I I I I I I I M I I I I I I I I I I I I I I M M I I M I I I M I I II I I II I I I I II I I I I I I I I I 

1141 CCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGTTCCGCCACCATCTACGGGC 1200 

3195 AC GAC AT C C GC AC G GAG AT G GAT GAG AT C C G C AAGAAC C T G G G CAT GT G C C C G C AG C AC A 3254 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I II I I I I I I I 

1201 AC GAC AT C C G C AC G GAG AT G GAT GAG AT C C G C AAGAAC C T G G G C AT GT G C C C G C AG C AC A 12 60 



3255 



3314 



ATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGA 

I I I I I I I I I I I I I I I I I I I I 1 I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1261 ATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGGTTCTACTCACGGCTCAAGA 1320 



3315 



3374 



G CAT G GCT C AG GAGGAGAT C C GC AGAGAGAT GGACAAGAT GAT C GAG GAC C T G GAGCT CT 
I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I III I I I I I I I I I I I I I 
1321 G CAT G GCT CAG GAGGAGAT C C GC AGAGAGAT GGACAAGAT GAT C GAG GAC C T GGAGCT CT 138 0 

3375 C C AAC AAAC G G C AC T C AC T G GT G CAG AC AT TGTCGGGTGG CAT G AAG C G C AAG C T G T C C G 3434 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I 
1381 C CAACAAAC GG C ACT C AC T G GT G CAG AC AT T GT C GGGT G GCAT GAAG C GCAAGCT GT CC G 144 0 

3435 TGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCG 3494 

I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 TGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTGGACGAGCCCACGGCGGGCG 150 0 



3495 



3554 



TGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCA 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
1501 TGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTGAAGTACAAGCCAGGCCGCA 1560 

3555 CCATCCTTCTGTCCACCCACCACATGGATGAGGCTGACCTGCTTGGGGACCGCATTGCCA 3614 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
1561 C CAT CCTTCTGTC C AC C C AC C AC AT G GAT GAG GCT GAC CTGCTTGGG GAC C G CAT T G C C A 1620 

3 615 TCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATG 3674 

I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
1621 TCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTCTTCCTCAAGGGCACCTATG 1680 

3675 GCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGC 3734 

I I I I II I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I 
1681 GCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAGCCGGGGGGCCCCCAAGAGC 1740 

3735 CAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGG 3794 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 CAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGCAGCTGCTCCGAGCTCCAGG 18 0 0 

3795 TGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGG 3854 

I I I II I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
18 01 TGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTGGTCTCAGACACAAGCACGG 18 60 

3 855 AGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCC 3914 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

18 61 AGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGGGCTTTCGAGCGCCTCTTCC 192 0 

3 915 AG C AC CT G G AGC G CAG C CT GG AT G C ACT G C AC CT CAG C AG CT T C G G GCT GAT G GAC AC G A 3974 

I I I I I II II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I II I I I I I I M 
1921 AG C AC C T GG AG C G C AGC C T G GAT GC AC T G C AC CT CAG CAG CTTCGGGCT GAT G GACAC GA 1980 



Qy 3975 CCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCTGGAGAACAGTGAGG 4034 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 19 81 CCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAGTCGCTGGAGAACAGTGAGG 204 0 

Qy 4035 CCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGG 4 094 

I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 041 CCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCGGAGGGCCCGGCGTCTGGGG 210 0 

Qy 4095 AGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGC 4154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 2101 AGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACCCAGTCGCAGGCATCGCTGC 2160 

Qy 4155 AGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCT 4214 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGAGCTGGCTACACCGACGTCT 2220 

Qy 4215 AT GG CGAC TACC GC CCCCTCTTT GAT AAC C CACAGGAC C CAGACAAT GT C AGC CT G CAAG 4274 

I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 AT GG C GAC TAC CGC CCCCTCTTT GAT AAC C CACAG GAC C CAGACAAT GT C AG C CT G CAAG 2280 

Qy 4275 AGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGT 4334 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 22 81 AGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGCCGCAAGCTGGACGGCGGGT 234 0 

Qy 4335 GGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCA 4394 

I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I 
Db 2341 GGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGCTTCCACTGCGCCCGCCGCA 2400 

Qy 4395 ACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGA 4 4 54 

I I I I I I I I I I I I I I I II I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 2401 ACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTCTTCGTCTGCGTGGCCATGA 2460 

Qy 4455 CCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCC 4514 

I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I II I I I I II I I I I I I I I I I I I I II I I I I I 
Db 2461 CCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCGCTGGTCCTGTCACCTTCCC 2520 

Qy 4515 AGT AC C AC AACT AC AC C C AGC C C C GT GG C AAT T T CAT C C C C T AC GC C AAC GAGGAG C G C C 4574 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 AGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCCTACGCCAACGAGGAGCGCC 2580 

Qy 4575 GCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCC 4 634 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2581 GCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAGCAGCTCGTGAGCACGTTCC 2 64 0 

Qy 4 635 GGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGG 4 694 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 
Db 2 641 GGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCTCCCGCCAACGGCTCGCTGG 2700 

Qy 4695 GGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACA 4754 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 01 GGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTGGCGGCTCGGTTCTTCGACA 2760 

Qy 4755 GCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCAC 4814 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 7 61 GCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCCAATTTCGTGCCACCCCCAC 2 820 



Qy 4815 CCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACG 4874 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2 821 CCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAGGACCTGCAGGCCTGGAACG 28 8 0 

Qy 4875 TCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCC 4934 

I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 28 81 TCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCGGCACCCTCCCTGCCGCGCC 2 940 

Qy 4935 TGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCA 4994 

I II I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I t I I I I 
Db 2941 TGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGCACCGGCTTCTCCTGCCCCA 3000 

Qy 4 995 GCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACAGGCGACATCCTGACCGACA 5054 

I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 30 01 GCAGT GT G GG C G GG C AC C C GC C C C AG AT G C G GGT GGT CAC AG GC GAC AT C CT GAC C GAC A 3060 

Qy 5055 TCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACC 5114 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I II I I II I I I II I I I I I I 

Db 3061 TCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCCGACCGCTTCCGACTGCACC 312 0 

Qy 5115 GGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCA 5174 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I II I I I 
Db 3121 GGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATCCCAGCCTCATTTGGCACCA 318 0 

Qy 5175 GGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACA 5234 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I 
Db 3181 GGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCTGCCCAGGTTTTCTACAACA 324 0 

Qy 5235 ACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTG 5294 

I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 ACAAGGGCTATCACAGCATGCCCACCTACCTCAACAGCCTCAACAACGCCATCCTGCGTG 3300 

Qy 52 95 CCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACC 5354 

I I I I I I I I I I I I I I I I I I M I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 3301 CCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACC 3360 

Qy 5355 CCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCG 5414 

I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 CCATGAATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCG 342 0 

Qy 5415 TCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCC 5474 

I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I 1 I I I I I I I I I ! I II I II I 

Db 3421 TCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCC 348 0 

Qy 5475 TCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCA 5534 

I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I II I I I I I I I I I I I I I I II I I I I I I 
Db 3481 TCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTTGTCAGCGGCTGCAACCCCA 3540 

Qy 5535 T CAT CT AC TGGCTGGC G AACT AC GT GT G GG AC AT G C T C AAC T AC CTGGTCCCC G CT AC CT 5594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I 
Db 3541 TCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCT 3600 

Qy 5595 GCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCC 5654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3601 GCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCC 3660 

Qy 5655 CTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGG 5714 
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Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 



3661 



5715 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
CTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGG 372 0 



CCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCT 5774 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I 
3721 CCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCT 3780 

5775 TCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGG 5834 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3781 TCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGG 38 4 0 

5835 ACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAA.ee 5894 
I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

3 841 ACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACC 3900 

5895 T GGGCCACGGGCT CATGGAGAT GGCCTACAACGAGTACAT CAAC GAGTACT ACGC CAAGA 5954 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3901 T GGGCCACGGGCT CATGGAGAT GGC CTACAACGAGTACAT CAAC GAGTACT AC GC CAAGA 3960 

5 955 T T GG C CAGT T T GACAAGAT GAAGT C CC CGT T C GAGT GGG ACAT T GT CAC C C GC GGACT GG 6014 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3961 TTGGCCAGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGG 4 020 

6015 TGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACT 6074 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I 

4 021 TGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACT 4080 

6075 TCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACG 6134 

II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 081 TCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACG 4140 

6135 T G GC C AGT GAGCG GC AGC GAGT GC T C CGG GGAGAC GCC GACAAT GACAT G GT CAAGAT T G 6194 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4141 T GGCCAGTGAGCGGCAGCGAGT GCTC CGGGGAGACGCCGACAAT GACAT GGT CAAGATT G 4200 

6195 AGAACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCC 6254 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4201 AGAACCTGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCC 4260 



6255 



4261 



6315 



TGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCA 6314 
I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II I I II I I I I I I I I I I I I I I I I I 
TGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCA 4320 



AGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCG 6374 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4321 AGAC C AG CACC TT CAAGAT G CT GAC C GGC GAC GAGAGCAC GAC GGGG G GC GAGGC CT T C G 4380 

6375 TCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCC 6434 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4381 TCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCC 4440 

64 35 CGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGC 6494 

I I I I I II II I I I I II I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I 

4 441 CGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGC 4 500 



6495 GGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGC 
I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



6554 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



4501 GGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGC 4560 

6555 TGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGA 6614 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

4561 TGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGA 4620 

6615 AGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCA 6674 

| | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

4621 AGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCA 468 0 

6675 CCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCA 6734 

I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

4681 CCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCA 474 0 

67 35 AGAC AG GGC GT T CAGT G GT GCT GAC AT C AC ACAG CAT G GAG GAGT G C GAGGCGCT GT GC A 67 94 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4741 AGAC AGGG C GT T CAGT G GT GCT GAC AT C AC ACAG CAT G GAG GAGT GC GAG GC G CT GT GC A 4 8 00 

6795 CGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGA 6854 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I II 

4 8 01 CGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGA 4 8 60 

6855 AGAACCGGTTT GGAGAT GGCTACAT GAT CACGGT GCGGACCAAGAGCAGCCAGAGT GTGA 6914 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

48 61 AGAACCGGTTT GGAGAT GGCTACAT GAT CACGGT GC GGACCAAGAGCAGCCAGAGT GTGA 4 920 

6915 AGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACC 6974 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I 

4 921 AGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACC 498 0 

697 5 ACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCA 7034 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

4981 ACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCA 504 0 

7035 AGAT G GAG CAGGT GT CT GGC GT G CT G GG CAT C GAGGACT ACT C GGT C AGC C AGAC CACAC 7094 

M I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I M I I I I I I I I I I 

5041 AGAT GGAGCAGGTGTCTGGCGT GCT GGGCATCGAGGACTACTC GGT CAGCCAGAC CACAC 5100 

7095 T GGACAAT GT GTT CGT GAACT T T G C CAAGAAG CAGAGT GAC AAC CT G GAGCAG CAGGAGA 7154 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5101 T GGACAAT GTGTT CGTGAACTTT GC CAAGAAGCAGAGT GACAAC CT GGAGCAGCAGGAGA 5160 

7155 CGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCC 7214 

I I M I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I 

5161 CGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCC 5220 

7215 GGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGG 7274 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

5221 GGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGG 5280 

7275 AG GAC GAG G G C C T CAT C AG C T T C GAG GAG G A G C G G G C C C AG CTGTCCTT C AAC AC G GAC A 7334 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

52 81 AGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACA 534 0 

7335 CGCTCTGCT GAC C AC C C AG AGC T GG GC C AG G GAG GAC AC GCT C CAC T GAC C AC C C AG AG C 7394 

I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I 

5341 CGCTCTGCT GAC CAC C C AG AG C T G G G C C AG G GAG GAC AC G C T C CAC T GAC CAC C C AGAG C 5400 



Qy 7395 TGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTG 7454 

I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 54 01 TGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTG 54 60 

Qy 74 55 GAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGG 7514 

I I I I M I I I I I II I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 54 61 GAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGTCCTGCGG 5520 

Qy 7515 TCACTGCGGTTGCCGCCCCT 7534 

I I I I I I I I I I I I I I I I I I I 
Db 5521 TCACTGCGGTTGCCGGCCCT 5540 



RESULT 13 
US-10-342-887-47 
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Query Match 65.7%; Score 5285; DB 13; Length 5285; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5285; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 2756 GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 2815 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 60 

Qy 2 816 TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 2 875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 61 TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 120 



Qy 



287 6 TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 2935 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 121 TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 18 0 

Qy 2936 GCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTG 2995 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I 
Db 181 G C CAT GGAGAG CCGGCGCTTT GAG GAGAC C C GT G GC AT GGAGGAGGAG C C C AC C C AC CT G 240 

Qy 2 99 6 CCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCC 3055 

I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I II I I I I I I I I I I I I I I I I I I I | | | | I I I 
Db 241 C CT CT GGTT GT CT GC GT G GACAAACT C AC CAAGGT C T ACAAGGAC GACAAGAAG C T G GC C 300 

Qy 3056 C T G AAC AAG C T GAG C CT GAAC CT C T AC GAGAAC C AG GTGGTCTCCTTCT T GGGC C AC AAC 3115 

I II I I I I I I II I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I It I I I I I I I I 

Db 301 CTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAAC 360 

Qy 3116 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 3175 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 42 0 

Qy 3176 T CC GC CACCAT CTACGGGCACGACAT CCGCACGGAGAT GGAT GAGAT CC GCAAGAACCT G 3235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 421 T C C G C C AC CAT C T AC G G G C AC G AC AT C C G C AC G GAGAT G GAT GAGAT C C G C AAGAAC C T G 4 8 0 

Qy 3236 GG C AT GT GC CC GCAGC ACAAT GT G CT CT TT GACC GGCT CAC G GT G GAG GAACAC CT CT G G 3295 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 481 GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 54 0 

Qy 3296 T T CT ACT CAC G GCT C AAGAGC AT GGCT CAG GAGGAGAT C C GC AGAGAGAT GGACAAGAT G 3355 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TTCTACT CACGGCTCAAGAGCAT GGCTCAGGAGGAGAT CCGCAGAGAGATGGACAAGATG 600 

Qy 3356 ATCGAGGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGC 3415 

I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 601 AT C GAGGAC CT GGAG CT CT C C AACAAAC GGCACT CACT GGT G CAGAC AT T GT C GGGT GG C 660 

Qy 3416 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 3475 

I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I 
Db 661 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 720 

Qy 347 6 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 3535 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 78 0 

Qy 3536 AAGT ACAAG C CAG GC CGC AC CAT C CT T CT GT C CAC C CAC CAC AT G GAT GAGGCT GAC CT G 3595 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AAGT ACAAG C CAG GC C GC AC CAT CCTTCTGTC CAC C CAC CAC AT GGAT GAG GC T GAC CT G 84 0 

Qy 3596 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 3655 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I 
Db 841 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 900 

Qy 3656 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 3715 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 960 

Qy 3716 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 3775 

I I I I I I I I I I I I I I I I I I I | | | | | | | | I I | I | M | I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 9 61 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 102 0 

Qy 377 6 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 3835 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 1080 

Qy 3836 GTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGG 38 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 10 81 GTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGG 1140 

Qy 38 96 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 3955 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II II I I II I I I I I I I I I I I I I I I I I I I I 
Db 1141 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 1200 

Qy 3956 T T C G GGCT GAT G GAC ACGAC C C T GGAG GAAGT GT T CCT C AAGGT GT C GGAG GAG GAT C AG 4015 

I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I 
Db 12 01 T T C G GGCT GAT G GAC AC GAC CCT GGAG GAAGT GT T CCT CAAGGT GT C GGAGGAG GAT C AG 1260 

Qy 4 016 TCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCG 4 075 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I II I II I I I I I I I I I I I I I I I I I 
Db 12 61 TCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCG 132 0 

Qy 4076 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 4135 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 1380 

Qy 4136 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 4195 

I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 144 0 

Qy 4196 GCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCA 4255 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I II I I II I I I I I I I I I I I I I I I I 
Db 1441 GC T G GCT AC AC C GAC GT CT AT GG C GAC T ACC GC C CCCTCTTT GAT AAC C C AC AG GAC C CA 1500 

Qy 4256 GACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGC 4315 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I 
Db 1501 GACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGC 1560 

Qy 4316 CGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGC 4375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 CGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGC 1620 

Qy 4 376 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 4435 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 1680 

Qy 4436 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 4495 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 1740 

Qy 4496 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 4555 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 17 41 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 1800 

Qy 4556 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 4615 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I M 
Db 18 01 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 1860 



Qy 4616 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 4675 

I I I I I I I I I I I I I I I I II 1 I I I I I I I I I I I I I II I M I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 61 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 192 0 

Qy 4 67 6 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 4735 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 19 80 

Qy 4736 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 4795 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 2040 

Qy 47 96 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 4 8 55 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I II 
Db 2041 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 2100 

Qy 4856 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 4915 

I 1 I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 2160 

Qy 4 916 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 4 975 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I II I II I I I I I I I I I I I I I I I I 
Db 2161 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 222 0 

Qy 4976 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 5035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2221 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 2280 

Qy 5036 GGCGACATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCC 5095 

I II I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 G GC GACAT C CT GACC GACAT C AC C GGCC ACAAT GT CT CT GAGT AC CT G CT CT T C AC C T C C 234 0 

Qy 5096 GACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTG7^GTCCATC 5155 

I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2341 GAC C GC T T CC GACT G C AC C GGT AT GG GGC C AT CAC CT T T GGAAAC GT C CT GAAGT C CAT C 24 00 

Qy 5156 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 5215 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 24 60 

Qy 5216 G C C C AGGT T T T CT AC AACAAC AAGG G CT AT CAC AG CAT G C C CAC C T AC CT C AAC AG C CT C 5275 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

Db 2461 G C CC AGGT T T T CT AC AACAAC AAG G G CT AT C ACAG CAT G CC C AC C T AC CT C AAC AG C CT C 2520 

Qy 527 6 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 5335 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 

Db 2521 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 2580 

Qy 5336 AT CAC C G T CAC C AAC CAC C C CAT G AAT AAG AC C AG C G C C AG CCTCTCCCTG GAT T AC C T G 5395 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AT CAC C GT CAC C AAC CAC C C CAT GAAT AAGAC CAG C G C C AGC C T CT C C CT GGAT T AC CT G 2640 

Qy 5396 CTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCG 5455 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 CTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCG 2700 



Qy 5456 GCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTT 5515 

M I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | | | | | I I I I I I I I I I I I II | I I I 
Db 2701 GCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTT 2760 

Qy 5516 GTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTC7VAC 5575 

I I I I I I I I I I I I I I I I I II I II I I I I II II I I I I I I I I I II I I I I II I M II I I I I I I I I 

Db 2761 GTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAAC 2820 

Qy 5576 TACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTAC 5635 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 TACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTAC 28 80 

Qy 5636 ACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATC 5695 

M I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 ACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATC 2 94 0 

Qy 5696 ACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTC 5755 

I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 ACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTC 3000 

Qy 5756 CT CATT GT CAT C AAT C T CTT CAT C G GCAT CACC GC C ACC GT G G C CAC CT T C CT GCT ACAG 5815 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3001 CTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAG 3060 

Qy 5816 CTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTC 5875 

I I I I I I I I I I I I I I I I I I I I I I I I I I I Ml I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3061 CT CT T C GAGCAC GACAAG GAC CT GAAG GT T GT CAAC AGT T AC C T GAAAAG CT GCTTCCTC 312 0 

Qy 5876 AT T T T C C C CAAC T AC AAC CT GGG C CAC G G GC T CAT GGAGAT G G C CT ACAAC GAGT AC AT C 5935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I 

Db 3121 AT TT T C C C CAACTACAAC C T GG GC CAC GG GCT CAT GGAGAT GG C CT ACAAC GAGT AC AT C 318 0 

Qy 5936 AAC GAG T AC T AC G C C AAG AT T G G C C AG T T T GACAAG AT G AAGT CCCCGTTC GAGT G G GAC 5995 

I I I M II I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I II I I I I I I I I II I I I I || I I | 
Db 3181 AAC GAGT ACT AC GC C AAGAT T G G C CAGT T T GAC AAGAT GAAGT CCCCGTTC GAGT G GGAC 324 0 

Qy 5996 ATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACC 6055 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I M I I I I I I I I I I 
Db 3241 ATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACC 3300 

Qy 6056 ATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCT 6115 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 3301 ATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCT 3360 

Qy 6116 GT GGAGGAT GAT GT GGAC GT GGCC AGT GAGC GGC AGC GAGT GC T C C G GG GAGAC GC C GAC 6175 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I 
Db 3361 GT GGAGGAT GAT GT GGAC GT GG C CAGT GAG C GG CAG C GAGT GC T C CG G GGAGAC G C C GAC 3420 

Qy 617 6 AAT GACAT GGTCAAGATT GAGAAC CT GACCAAGGT CTACAAGT CCCGGAAGATT GGCCGT 6235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 AAT GACAT GGT CAAGAT T GAGAAC C T GAC CAAG GT CTACAAGT CC C G GAAGAT T GG C C GT 34 8 0 

Qy 6236 ATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTG 62 95 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I 
Db 34 81 ATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTG 354 0 

Qy 62 96 GG C GT CAAC GGT GC GG GCAAGAC C AGC AC CTT CAAGAT G CT GAC C GGCGAC GAGAG CAC G 6355 



1 1 1 1 1 1 II 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 



Db 


3541 


GGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACG 


3600 


Qy 


6356 


ACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAG 
1 M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 I M 1 1 1 1 1 I 1 II 1 1 I 1 1 I | | | | M 1 
ACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAG 


6415 


Db 


3601 


3660 


Qy 

Db 


6416 
3661 


CAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAG 

1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 II 1 1 1 1 1 1 1 1 1 
CAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAG 


6475 
3720 


Qy 


6476 


CACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I I I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTG 


6535 


Db 


3721 


3780 


Qy 

Db 


6536 
3781 


AAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTAC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AAGT G GGC T CT GGAGAAGCT GGAG C T GAC C AAGTAC GC AGACAAG CCGGCTGG CAC CT AC 


6595 
3840 


Qy 


6596 


AGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTC 

1 M M 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

AGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTC 


6655 


Db 


3841 


3900 


Qy 


6656 


ATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAAC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 
ATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAAC 


6715 


Db 


3901 


3960 


Qy 


6716 


CT C AT CCT C GAC CT CAT CAAGAC AG GG C GT T CAGT GGT GCT GAC AT C ACACAG CAT G GAG 
M 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 | I I I I I I I I I I | | | | | | | | | || | | | | | | | | | | | | | | | | | | 
C T CAT C CT C GAC CT CAT CAAGACAGG GC GT T CAGT G GT GCT GAC AT C AC AC AGCAT GGAG 


6775 


Db 


3961 


4020 


Qy 


6776 


GAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTG 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I II I I I M 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 
GAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTG 


6835 


Db 


4021 


4080 


Qy 

Db 


6836 
4081 


GGCAGCATC CAGCACCT GAAGAAC CGGTTT GGAGAT GGCTACAT GAT CAC GGTGCGGACC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 M 1 1 1 1 1 1 II 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 
GGCAGC AT C C AGCAC CT GAAGAAC C G GT TT GGAGAT G G CT AC AT GAT CAC G GT GC GGAC C 


6895 
4140 


Qy 


6896 


AAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCC 

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
AAGAGCAGC CAGAGT GT GAAG GAC GT GGT GCGGT T C TT CAAC C GCAACT T C CC GGAAG C C 


6955 


Db 


4141 


4200 


Qy 


6956 


AT G CT CAAGGAGC GG CAC C AC ACAAAGGT G CAGTAC C AG C T CAAGT C GGAGCACAT CT C G 

1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
ATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCG 


7015 


Db 


4201 


4260 


Qy 


7016 


CTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTAC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
CT GGC CCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGT GCT GGGCATCGAGGACT AC 


7075 


Db 


4261 


4^7 0 


Qy 


7076 


T C G GT CAG C CAG AC CAC ACT G GAC AAT GT GT T C GT GAAC T T T G C C AAGAAGC AGAGT GAC 
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 I I I I I I 1 1 1 1 1 1 1 1 1 1 II 1 II 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 
TCGGTCAGCCAGACCACACTGGACAATGTGTTCGTG7^CTTTGCCAAGAAGCAGAGTGAC 


7135 


Db 


4321 


4380 


Qy 


7136 


AACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTG 


7195 



I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 4381 AACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTG 4 44 0 

Qy 7196 CTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAG 7255 

I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I | I I I 
Db 4441 CTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAG 4500 

Qy 7256 C C C GAG G AC C T G G AC AC G GAG G AC GAG G G C C T CAT C AG C T T C GAG GAG GAG C G G G C C C AG 7315 

I I I I I II I I II I I I I II I II I 1 I I I I I I I I I I I I M I I I I I I I I I I II I I II I I I II I I I 
Db 4501 CC C GAGGAC CT GGACAC GGAGGAC GAGGGCCT CAT CAGCTT CGAGGAGGAGC GGGC CCAG 4560 

Qy 7316 CTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGC 7375 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I I I I 
Db 4561 CTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGC 4620 

Qy 737 6 TCCACTGACCACCCAGAGCTGGGCCAGGGACTCAACAATGGGGACAGAAGTCCCCCAGTG 7435 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 4 621 T C CACT GAC CAC C CAGAGC T GG G C C AGGGACT CAACAAT GG GGACAGAAGT C C C C CAGT G 4 68 0 

Qy 7436 CCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGT 74 95 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4681 CCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGT 474 0 

Qy 7496 ACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCC 7555 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 ACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCC 4 8 00 

Qy 7556 GGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7 615 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 4 8 01 GGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 4 8 60 

Qy 7616 CCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGC 7675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4861 CCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGC 4920 

Qy 7 676 TGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGC 7735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 921 TGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGC 4 980 

Qy 7736 CGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGG 7795 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4981 CGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGG 5040 

Qy 7796 CTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGG 7 855 

I I I M I I I I I I I Ill I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 5041 CTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGG 5100 

Qy 7856 GCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGA 7915 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 GCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGA 5160 

Qy 7916 CCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCAC 7975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5161 CCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCAC 522 0 

Qy 7976 CTCCCTGG GAG CCGGGCCT GT AC AT AG C G C AC AGAT GTTTGTTT T AAAT AAAT AAAC AAA 8035 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5221 CTCCCTGG GAG CCGGGCCT GT ACAT AGC G CAC AG AT GTTTGTTT T AAAT AAAT AAAC AAA 5280 



Qy 8036 ATGTC 8040 

I I I I I 

Db 52 81 ATGTC 5285 



RESULT 14 
US-10-172-118-47 
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GENERAL INFORMATION: 
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Query Match 65.7%; Score 5285; DB 13; Length 5285; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 5285; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 2815 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | M I I I I I I I I i | | | | | | | | | | 
GGCATCCTCACGTGGTACATTGAGGCTGTGCACCCAGGCATGTACGGGCTGCCCCGGCCC 60 

TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 2875 
M I I II I I I I I 1 I I I I I I I I I | | | | | | | | | | I I I I I I I I I I I I I I I I I I I I | I I I I I I I I 
TGGTACTTCCCACTGCAGAAGTCCTACTGGCTGGGCAGTGGGCGGACAGAAGCCTGGGAG 12 0 

TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 2 935 

I M I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | 1 | | | | M I I I II I I ! I I I I 
TGGAGCTGGCCGTGGGCACGCACCCCCCGCCTCAGTGTCATGGAGGAGGACCAGGCCTGT 180 

GCCATGGAGAGCCGGCGCTTTGAGGAGACCCGTGGCATGGAGGAGGAGCCCACCCACCTG 2995 

M I I I I I I I I I I I I I I I I I I I | I | | | | | | | | | | | | M I I II I I I I I I M I I I I I I I I I I I 

GC CAT G GAGAG CCGGCGCTTT GAG GAGAC C C GT G G CAT GGAG GAG GAGC CC AC CC AC CT G 24 0 



Qy 


2756 


Db 


1 


Qy 


2816 


Db 


61 


Qy 


2876 


Db 


121 


Qy 


2936 


Db 


181 



QY 2996 CCTCTGGTTGTCTGCGTGGACAAACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCC 3055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I 



Db 241 CCTCTGGTTGTCTGCGTGGACA?^ACTCACCAAGGTCTACAAGGACGACAAGAAGCTGGCC 300 

Qy 3056 CTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAAC 3115 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I | | | | | | | | | I 
Db 301 CTGAACAAGCTGAGCCTGAACCTCTACGAGAACCAGGTGGTCTCCTTCTTGGGCCACAAC 360 

Qy 3116 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 3175 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 361 GGGGCGGGCAAGACCACCACCATGTCCATCCTGACCGGCCTGTTCCCTCCAACGTCGGGT 420 

Qy 317 6 T C C G C C AC CAT C T A C G G G C AC G AC AT C C G C AC G GAG AT G GAT GAG AT C C G C AAG AAC C T G 3235 

I I I I M I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I | I | | | | 

Db 421 T C C GC CAC CAT CT AC GGGC AC GACAT C C GC AC G GAGAT GGAT GAGAT C C G C AAGAAC CT G 4 80 

Qy 3236 GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 32 95 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | I I I I I I | | | | | | | | | | | | | | | | | | | 

Db 481 GGCATGTGCCCGCAGCACAATGTGCTCTTTGACCGGCTCACGGTGGAGGAACACCTCTGG 54 0 

Qy 32 96 T T C T AC T CAC G G C T C AAG AG CAT G G C T C AG GAG GAGAT C C G C AG AG AG AT G G AC AAG AT G 3355 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 TT CT ACT CACGGCT CAAGAGCAT GGCT CAGGAGGAGAT CCGCAGAGAGAT GGACAAGAT G 600 

Qy 335 6 AT C GAGGAC CT GGAGCT CT C CAACAAAC G GC AC T CACT GGT G C AGAC AT T GT C G GGT G GC 3415 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 ATCGAGGACCTGGAGCTCTCCAACAAACGGCACTCACTGGTGCAGACATTGTCGGGTGGC 660 

Qy 3416 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 3475 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 661 ATGAAGCGCAAGCTGTCCGTGGCCATCGCCTTCGTGGGCGGCTCTCGCGCCATCATCCTG 720 

Qy 3476 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 3535 

I I I I M I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I 
Db 721 GACGAGCCCACGGCGGGCGTGGACCCCTACGCGCGCCGCGCCATCTGGGACCTCATCCTG 78 0 

Qy 353 6 AAGT AC AAGC C AGGC C G CAC CAT CCTTCTGTC CAC C CAC CAC AT G GAT GAGG C T GAC C T G 3595 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AAGT ACAAG CCAGG C C GCAC CAT CCTTCTGTC CAC C CAC CAC AT GGAT GAGGCT GACCT G 84 0 

Qy 3596 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 3655 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 CTTGGGGACCGCATTGCCATCATCTCCCATGGGAAGCTCAAGTGCTGCGGCTCCCCGCTC 900 

Qy 3656 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 3715 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TTCCTCAAGGGCACCTATGGCGACGGGTACCGCCTCACGCTGGTCAAGCGGCCCGCCGAG 960 

Qy 3716 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 3775 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 CCGGGGGGCCCCCAAGAGCCAGGGCTGGCATCCAGCCCCCCAGGTCGGGCCCCGCTGAGC 1020 

Qy 37 7 6 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 3835 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 

Db 1021 AGCTGCTCCGAGCTCCAGGTGTCCCAGTTCATCCGCAAGCATGTGGCCTCCTGCCTGCTG 108 0 

Qy 3836 GTCTCAGACACAAGCACGGAGCTCTCCTACATCCTGCCCAGCGAGGCCGCCAAGAAGGGG 3895 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I | | | | I | | | | | | | | | | | | | | | | | | | | | || | | | 
Db 1081 GT C T C AG AC AC AAG CAC G GAG C T C T C C T AC AT C C T G C C C AG C GAG G C C G C C AAG AAG G G G 1140 



Qy 38 96 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 3955 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | I 
Db 1141 GCTTTCGAGCGCCTCTTCCAGCACCTGGAGCGCAGCCTGGATGCACTGCACCTCAGCAGC 1200 

Qy 3956 TTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAG 4 015 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 TTCGGGCTGATGGACACGACCCTGGAGGAAGTGTTCCTCAAGGTGTCGGAGGAGGATCAG 1260 

Qy 4016 T C G C T G GAGAAC AGT GAG G C C GAT GT G AAGGAGT C C AG GAAGGAT GTGCTCCCTGGGGCG 4075 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | | M I I I I I I I I 
Db 12 61 TCGCTGGAGAACAGTGAGGCCGATGTGAAGGAGTCCAGGAAGGATGTGCTCCCTGGGGCG 1320 

Qy 4076 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 4135 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I! I I I I I I I I I I I 
Db 1321 GAGGGCCCGGCGTCTGGGGAGGGTCACGCTGGCAATCTGGCCCGGTGCTCGGAGCTGACC 13 8 0 

Qy 4136 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 4195 

I I I I I I I I M I I I I I I II I I I I I I I I I I I I I I I I I I I I I ! I I I I M I I I I I I I I I I I I I I 

Db 1381 CAGTCGCAGGCATCGCTGCAGTCGGCGTCATCTGTGGGCTCTGCCCGTGGCGACGAGGGA 14 40 

Qy 4196 GCTGGCTACACCGACGTCTATGGCGACTACCGCCCCCTCTTTGATAACCCACAGGACCCA 4255 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I 
Db 1441 GC T GGCT AC AC C GAC GT CT AT G G C GAC T AC CGCCCCCTCTTT GATAAC C CAC AGGAC C C A 1500 

Qy 42 56 GACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGC 4315 

I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 GACAATGTCAGCCTGCAAGAGGTGGAGGCAGAGGCCCTGTCGAGGGTCGGCCAGGGCAGC 1560 

Qy 4316 CGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGC 4375 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 1561 CGCAAGCTGGACGGCGGGTGGCTGAAGGTGCGCCAGTTCCACGGGCTGCTGGTCAAACGC 162 0 

Qy 437 6 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 4435 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 1621 TTCCACTGCGCCCGCCGCAACTCCAAGGCACTCTTCTCCCAGATCTTGCTGCCAGCCTTC 168 0 

Qy 4436 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 4495 

I I I I I I I I I I I I II I I I II I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
Db 1681 TTCGTCTGCGTGGCCATGACCGTGGCCCTGTCCGTCCCGGAGATTGGTGATCTGCCCCCG 1740 

Qy 4496 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 4555 

I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1741 CTGGTCCTGTCACCTTCCCAGTACCACAACTACACCCAGCCCCGTGGCAATTTCATCCCC 1800 

Qy 4 55 6 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 4 615 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 
Db 18 01 TACGCCAACGAGGAGCGCCGCGAGTACCGGCTGCGGCTATCGCCCGACGCCAGCCCCCAG 1860 

Qy 4 616 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 4 675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CAGCTCGTGAGCACGTTCCGGCTGCCGTCGGGGGTGGGTGCCACCTGCGTGCTCAAGTCT 192 0 

Qy 4 67 6 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 4735 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 CCCGCCAACGGCTCGCTGGGGCCCACGTTGAACCTGAGCAGCGGGGAGTCGCGCCTGCTG 198 0 



Qy 4736 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 4795 

I I I I I I I I I M II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | || | | | | | | | | 
Db 1981 GCGGCTCGGTTCTTCGACAGCATGTGTCTGGAGTCCTTCACACAGGGGCTGCCACTGTCC 204 0 

Qy 4 796 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 4 855 

I I I I I I I I I I I I I I M I II I I I I I I I I I I I I I I I I I I I | I I | | | | | | | | | | | | | | | | | | | 
Db 2041 AATTTCGTGCCACCCCCACCCTCGCCCGCCCCATCTGACTCGCCAGCGTCCCCGGATGAG 2100 

Qy 4 8 56 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 4 915 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II || I | | | | | | | | 
Db 2101 GACCTGCAGGCCTGGAACGTCTCCCTGCCGCCCACCGCTGGGCCAGAAATGTGGACGTCG 2160 

Qy 4916 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 4975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I 

Db 2161 GCACCCTCCCTGCCGCGCCTGGTACGGGAGCCCGTCCGCTGCACCTGCTCTGCGCAGGGC 2220 

Qy 4 976 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 5035 

I I I M I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 ACCGGCTTCTCCTGCCCCAGCAGTGTGGGCGGGCACCCGCCCCAGATGCGGGTGGTCACA 22 80 

Qy 5036 GGCGACATCCTGACCGACATCACCGGCCACT^ATGTCTCTGAGTACCTGCTCTTCACCTCC 5095 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 22 81 GGCGACATCCTGACCGACATCACCGGCCACAATGTCTCTGAGTACCTGCTCTTCACCTCC 2340 

Qy 5096 GACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATC 5155 

I I I M I I I I M I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GACCGCTTCCGACTGCACCGGTATGGGGCCATCACCTTTGGAAACGTCCTGAAGTCCATC 2400 

Qy 5156 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 5215 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I | | 
Db 2401 CCAGCCTCATTTGGCACCAGGGCCCCACCCATGGTGCGGAAGATCGCGGTGCGCAGGGCT 2460 

Qy 5216 G C C C AGGT T T T C T AC AACAAC AAG G GCT AT C ACAGC AT GC C C AC C T AC CT C AACAGC CT C 5275 

I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2 4 61 G C C C AG GT TT T CT ACAACAACAAGGG C TAT CACAGCAT G C C C AC CT AC CT CAAC AGC CT C 2520 

Qy 5276 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 5335 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I 
Db 2521 AACAACGCCATCCTGCGTGCCAACCTGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGC 2580 

Qy 533 6 AT C AC C GT C AC CAAC C AC C C CAT G AAT AAG AC C AG C G C C AG CCTCTCCCTG GAT T AC C T G 5395 

I I II I I I I I I I I I I I I I I I I | M M | I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AT CAC C GT CAC CAAC C AC C C CAT GAATAAGAC CAGC GC C AGCCT CT C C CT G GAT T AC C T G 2 640 

Qy 5396 CTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCG 5455 

I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 2 641 CTGCAGGGCACGGATGTCGTCATCGCCATCTTCATCATCGTGGCCATGTCCTTCGTGCCG 2700 

Qy 5456 GCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTT 5515 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 01 GCCAGCTTCGTTGTCTTCCTCGTGGCCGAGAAGTCCACCAAGGCCAAGCATCTGCAGTTT 27 60 

Qy 5516 GTCAGCGGCTGCAACCCCATCATCTACTGGCTGGCGAACTACGTGTGGGACATGCTCAAC 5575 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2761 GT CAG C G GCT G CAAC CC CAT CAT C T ACT GGC T G G C GAACT AC GT GT G G GAC AT GCT CAAC 2820 

Qy 5576 TACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTAC 5635 



Db 2 821 TACCTGGTCCCCGCTACCTGCTGTGTCATCATCCTGTTTGTGTTCGACCTGCCGGCCTAC 28 80 

Qy 5636 ACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATC 5695 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I | I I I 
Db 28 81 ACGTCGCCCACCAACTTCCCTGCCGTCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATC 2940 

Qy 5 696 ACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTC 5755 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | 
Db 2 941 ACGCCCATCATGTACCCGGCCTCCTTCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTC 3000 

Qy 5756 CTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAG 5815 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CTCATTGTCATCAATCTCTTCATCGGCATCACCGCCACCGTGGCCACCTTCCTGCTACAG 3060 

Qy 5816 CTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTC 5875 

I I I I I I I I I I I I II M I II I I I I I I I I I I I I I I I I I I 

Db 3061 CTCTTCGAGCACGACAAGGACCTGAAGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTC 3120 

Qy 587 6 ATTTT C C CC AACTAC AAC CT GGGC CAC GGGCT CAT GGAGAT GGC CT ACAAC GAGTACAT C 5935 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 AT T T T C C C CAACT ACAAC C T G G G C CAC G G GCT CAT G GAGAT G GC CT ACAAC GAGTACAT C 3180 

Qy 593 6 AAC GAGT AC T ACG CCAAGAT T GGC C AGT T T GACAAGAT GAAGT C C C CGT T C GAGT GGGAC 5995 

I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3181 AAC GAGT ACT ACGC CAAGAT T G G C C AGT T T GACAAGAT GAAGT C C C C GT T C GAGT GG GAC 32 40 

Qy 5996 ATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACC 6055 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I 
Db 3241 ATTGTCACCCGCGGACTGGTGGCCATGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACC 3300 

Qy 6056 ATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCT 6115 

I M II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II II I I I I I 

Db 3301 ATCATGTGCCAGTACAACTTCCTGCGGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCT 3360 

Qy 6116 GTGGAGGATGATGTGGACGTGGCCAGTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGAC 6175 

I I I I I I I I I M I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I | | | | || | | | 
Db 3361 GT G GAGGAT GAT GT G GAC GT GG C C AGT GAGC GGCAGC GAGT GCT C C G G GGAGAC G CC GAC 3420 

Qy 6176 AAT GACAT G GT CAAGAT T GAGAAC CT GACCAAGGT CT ACAAGT C C C G GAAG AT T GGC C GT 6235 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 AAT GACAT G GT CAAGAT T GAGAAC C T GAC C AAGGT C TAC AAGT C C C G GAAG AT T G GC C GT 34 8 0 

Qy 6236 ATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTG 6295 

I I I M I I I I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 3481 ATCCTGGCCGTTGACCGCCTGTGCCTGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTG 3540 

Qy 6296 G G C GT CAAC GGT G C G GGC AAGAC C AG CAC C T T CAAGAT GCT GAC C GG C GAC GAGAG CAC G 6355 

I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I M | I I II I I 

Db 3541 GGCGTCAACGGTGCGGGCAAGACCAGCACCTTCAAGATGCTGACCGGCGACGAGAGCACG 3600 

Qy 6356 ACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAG 6415 

I I I I I I I I I M I I I I I I I I I | | | | | | | | | | I | | | | | | || | | | | | | | || | | | | | | | | || | | 
Db 3601 ACGGGGGGCGAGGCCTTCGTCAATGGACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAG 3660 

Qy 6416 CAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAG 6475 

I M I I I I I I I I I I I I I I I | | | | | | | | | | || | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 



Db 


3661 


Qy 


6476 


Db 


3721 


Qy 


6536 


Db 


3781 


Qy 


6596 


Db 


3841 


Qy 


6656 


Db 


3901 


Qy 


6716 


Db 


3961 


Qy 


6776 


Db 


4021 


Qy 


6836 


Db 


4081 


Qy 


6896 


Db 


4141 


Qy 


6956 


Db 


4201 


Qy 


7016 


Db 


4261 


Qy 


7076 


Db 


4321 


Qy 


7136 


Db 


4381 


Qy 


7196 


Db 


4441 


Qy 


7256 


Db 


4501 



CAGAGCCTCGGCTACTGCCCGCAGTGTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAG 372 0 

CACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTG 6535 
M I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
CACCTGCAGCTGTACACGCGGCTGCGTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTG 378 0 

AAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTAC 6595 

I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 

AAGTGGGCTCTGGAGAAGCTGGAGCTGACCAAGTACGCAGACAAGCCGGCTGGCACCTAC 3 84 0 

AGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTC 6655 
I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I || | I | I I I 
AGCGGCGGCAACAAGCGGAAGCTCTCCACGGCCATCGCCCTCATTGGGTACCCAGCCTTC 3900 

ATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAAC 6715 

I I I I I M I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
ATCTTCCTGGACGAGCCCACCACAGGCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAAC 3960 

CT C AT C CT CGAC CT CAT CAAGAC AG GGC GT T CAGT GGT GCT GACAT C AC AC AG CAT GGAG 677 5 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

CT CAT C CT CGAC CT CAT CAAGAC AGG G C GT T CAGT GGT GCT GACAT C AC AC AG CAT GGAG 4 02 0 

GAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTG 6835 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GAGTGCGAGGCGCTGTGCACGCGGCTGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTG 408 0 

G GC AG C AT CC AG CAC C T GAAGAAC C GGT T T G GAGAT GGC T ACAT GAT C AC GGT G C GG AC C 6895 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

G G C AGC AT C C AGCAC CT GAAGAAC C G GT T T G GAGAT G GC T ACAT GAT CACG GT G C G GAC C 414 0 

AAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCC 6955 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I 
AAGAGCAGCCAGAGTGTGAAGGACGTGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCC 42 00 

ATGCTCAAGGAGCGGCACCACACAAAGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCG 7015 
I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I | 
AT GCT CAAGGAG CG GC AC CACAC AAAG GT GCAGT AC CAGCT CAAGT C GGAG CAC AT CT C G 4260 

CTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTAC 7075 
I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CTGGCCCAGGTGTTCAGCAAGATGGAGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTAC 4 32 0 

T C GGT C AG CC AGAC CAC ACT GGACAAT GT GT T C GT GAACT T T GC CAAGAAGC AGAGT GAC 7135 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
T CGGT CAGC C AGAC CACACT G GACAAT GT GT T C GT GAAC T T T G CCAAGAAG CAGAGT GAC 4380 

AACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTG 7195 
I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
AACCTGGAGCAGCAGGAGACGGAGCCGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTG 4440 

CTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAG 7255 
I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
CTCAGCCTGCTCCGGCCCCGGTCTGCCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAG 4 5 00 

CCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAG 7315 
M I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II II I I I I II I I I I II I II I I I I I I I I I 
CCCGAGGACCTGGACACGGAGGACGAGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAG 4 5 60 



Qy 7316 CTGTCCTT CAAC AC GGAC AC GC T CT G C T GAC CAC C CAGAG CT GG GC C AG G GAG GAC AC G C 7375 

I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I M I I I I I I II I I I I I 
Db 4561 CTGTCCTTCAACACGGACACGCTCTGCTGACCACCCAGAGCTGGGCCAGGGAGGACACGC 4620 

Qy 7376 T C C ACT GAC CAC C C AGAGC T G G G C C AG G GAC T C AAC AAT G GG G AC AGAAGT C C C C C AGT G 7435 

I I I I M M I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I 
Db 4 621 T C CAC T GAC CAC C CAGAG C T G G G C C AG G GAC T CAAC AAT G G G G A C AG AAG T C C C C C AG T G 4 68 0 

Qy 7436 CCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGT 74 95 

I I I I I I I I I I I I I I I I I I I I I I I J I I I I I I I I I I I I I I I I I I I I I I I II 

Db 4 681 CCTGCCAGGGCCTGGAGTGGAGGTTCAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGT 47 4 0 

Qy 74 96 ACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCC 7555 

I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4741 ACTCGGCCATGCCCTGCGGTCACTGCGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCC 48 00 

Qy 7556 GGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 7615 

I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II | | | 

Db 48 01 GGCCCGGGCTGCGTACACCCTTGCCCTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCC 4 8 60 

Qy 7616 CCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGC 7675 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 48 61 CCTCGCCCCTGCCTGGCACTGCTCACCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGC 4920 

Qy 7 67 6 TGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGC 7735 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 4921 TGGCCTTTCTCCTGCCCGGCCTCGGAACCAGCTTTTCTCTCTTACGATGAAGGCTGATGC 4 98 0 

Qy 773 6 CGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGG 77 95 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 4981 CGAGAGCGGGCTGTGGGCGGAGCTGGGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGG 504 0 

Qy 7796 CTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGG 7855 

I I I I I I I I M I I I I I I I I I I II I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I I I I I I I 
Db 5041 CTCCTCTGGCCCTGCTCTCCTGCAGGGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGG 5100 

Qy 7 85 6 GCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGA 7915 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 5101 GCCAGCTGGCAGGTGGCAGGAATGGAGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGA 5160 

Qy 7916 CCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCAC 7975 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 5161 CCCCCCCCAACCCCCAGCTGCCATCGCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCAC 5220 

Qy 7976 CT C C CT G GGAGC C GGG C CT GT AC AT AGC GC ACAG AT GTT T GTT T TAAAT AAAT AAACAAA 8035 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | I I I | I | | 
Db 5221 CTCCCTGGGAGCCGGGCCTGTACATAGCGCACAGATGTTTGTTTTAAATAAATAAACAAA 52 8 0 

Qy 8036 ATGTC 8040 

I I I I I 

Db 52 81 ATGTC 52 85 

RESULT 15 
US-09-822-830A-36 

; Sequence 36, Application US/09822830A 
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Qy 5301 TGCCCAAGAGCAAGGGCAACCCGGCGGCTTACGGCATCACCGTCACCAACCACCCCATGA 53 60 

I M I I I M I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | 

Db 1 T G C C CAAGAGCAAGG G CAAC CCGGCGGCT T AC GG CAT C AC C GT CACCAAC C AC C CCAT GA 60 

Qy 5361 ATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCG 5420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 61 ATAAGACCAGCGCCAGCCTCTCCCTGGATTACCTGCTGCAGGGCACGGATGTCGTCATCG 12 0 

Qy 5421 CCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGG 5480 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I 

Db 121 CCATCTTCATCATCGTGGCCATGTCCTTCGTGCCGGCCAGCTTCGTTGTCTTCCTCGTGG 18 0 

Qy 5481 C C G AG AAGT C C AC C AAG G C C AAG CAT C T G C AG T T T GT C AG C G G C T G CAAC C C CAT CAT C T 5540 

I I I I I I I I I I I I I I I I I I I I II I I I I M I I I I I I I I I I I I I I I I I I I I M I I I I I 

Db 181 C C GAGAAGT CCAC CAAG G C CAAG CAT C T G CAGT T T GT CAGC G GCT G CAAC C C CAT CAT CT 24 0 

Qy 5541 ACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTG 5600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I | | II I I I I I I I I I I 
Db 241 ACTGGCTGGCGAACTACGTGTGGGACATGCTCAACTACCTGGTCCCCGCTACCTGCTGTG 300 

Qy 5601 TCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCG 5660 

I M I I II I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 301 TCATCATCCTGTTTGTGTTCGACCTGCCGGCCTACACGTCGCCCACCAACTTCCCTGCCG 360 

Qy 5661 TCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCT 5720 

I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I | I || | | | | | | | | | | | | | | | | | | | | | | 

Db 361 TCCTCTCCCTCTTCCTGCTCTATGGGTGGTCCATCACGCCCATCATGTACCCGGCCTCCT 420 



5721 TCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCG 57 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I 

421 TCTGGTTCGAGGTCCCCAGCTCCGCCTACGTGTTCCTCATTGTCATCAATCTCTTCATCG 480 

5781 GCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGA 584 0 

I I I I II I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 81 GCATCACCGCCACCGTGGCCACCTTCCTGCTACAGCTCTTCGAGCACGACAAGGACCTGA 540 

5841 AGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCC 5900 
I I I N I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
541 AGGTTGTCAACAGTTACCTGAAAAGCTGCTTCCTCATTTTCCCCAACTACAACCTGGGCC 600 

5901 ACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGAGTACTACGCCAAGATTGGCC 5960 

I I I I I I I I I I I I I I I I M I I I I I I I I I | | | | | | | | | | || I I I I I I I I | 

601 ACGGGCTCATGGAGATGGCCTACAACGAGTACATCAACGAGTACTACGCCAAGATTGGCC 660 

5961 AGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCA 6020 
I I I M I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | || | | | | | | | | | || 

661 AGTTTGACAAGATGAAGTCCCCGTTCGAGTGGGACATTGTCACCCGCGGACTGGTGGCCA 720 



6021 
721 
6081 



TGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGC 608 0 
I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
TGGCGGTTGAGGGCGTCGTGGGCTTCCTCCTGACCATCATGTGCCAGTACAACTTCCTGC 780 



GGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCA 614 0 

I I I I M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I 

781 GGCGGCCACAGCGCATGCCTGTGTCTACCAAGCCTGTGGAGGATGATGTGGACGTGGCCA 840 

6141 GTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGACATGGTCAAGATTGAGAACC 6200 

I M I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

841 GTGAGCGGCAGCGAGTGCTCCGGGGAGACGCCGACAATGACATGGTCAAGATTGAGAACC 900 



6201 
901 



TGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCC 6260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGACCAAGGTCTACAAGTCCCGGAAGATTGGCCGTATCCTGGCCGTTGACCGCCTGTGCC 



960 



62 61 TGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCA 6320 
N I I H I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | 
961 TGGGTGTGCGTCCTGGCGAGTGCTTCGGGCTCCTGGGCGTCAACGGTGCGGGCAAGACCA 1020 

6321 GCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATG 6380 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

1021 GCACCTTCAAGATGCTGACCGGCGACGAGAGCACGACGGGGGGCGAGGCCTTCGTCAATG 1080 

6381 GACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGT 6440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I || I I I I I I 

1081 GACACAGCGTGCTGAAGGAGCTGCTCCAGGTGCAGCAGAGCCTCGGCTACTGCCCGCAGT 114 0 

6441 GTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGC 6500 

I HI IN I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 GTGACGCGCTGTTCGACGAGCTCACGGCCCGGGAGCACCTGCAGCTGTACACGCGGCTGC 1200 

6501 GTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGC 6560 

I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I I I I I I I I I 

1201 GTGGGATCTCCTGGAAGGACGAGGCCCGGGTGGTGAAGTGGGCTCTGGAGAAGCTGGAGC 1260 



6561 TGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCT 6620 



Db ■ 12 61 TGACCAAGTACGCAGACAAGCCGGCTGGCACCTACAGCGGCGGCAACAAGCGGAAGCTCT 132 0 

Qy 6621 CCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAG 6680 

I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | || | | || | 

Db 1321 CCACGGCCATCGCCCTCATTGGGTACCCAGCCTTCATCTTCCTGGACGAGCCCACCACAG 1380 

Qy 6681 GCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAG 6740 

I I I I I I I I I M I I I I I I I I I I I I I I | | || | | | || | || | | | | | M I I I I I I I I I I I | | I I I 
Db 1381 GCATGGACCCCAAGGCCCGGCGCTTCCTCTGGAACCTCATCCTCGACCTCATCAAGACAG 144 0 

Qy 6741 GGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGC 68 00 

I I I I M II I I I I I I I I I I I I II I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 1441 GGCGTTCAGTGGTGCTGACATCACACAGCATGGAGGAGTGCGAGGCGCTGTGCACGCGGC 1500 

QY 68 01 TGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACC 6860 

I I M I I I II I I II I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 

Db 1501 TGGCCATCATGGTGAACGGTCGCCTGCGGTGCCTGGGCAGCATCCAGCACCTGAAGAACC 1560 

Qy 6861 GGT T T GGAGAT GG C TAC AT GAT CAC GGT GCG GACCAAGAGC AG C CAGAGT GT GAAGGACG 6920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I 
Db 1561 G GT T T G GAG AT G G C TAC AT GAT CAC GGT GCG GAC C AAGAGC AGC CAGAGT GT GAAG GAC G 1620 

Qy 6921 TGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAA 6980 

I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I || M I I I I I I I I 
Db 1621 TGGTGCGGTTCTTCAACCGCAACTTCCCGGAAGCCATGCTCAAGGAGCGGCACCACACAA 168 0 

Qy 6981 AGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGG 7 04 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | | | I I I I I I I I I I I I I I I I I | I | | 
Db 1681 AGGTGCAGTACCAGCTCAAGTCGGAGCACATCTCGCTGGCCCAGGTGTTCAGCAAGATGG 174 0 

Qy 7041 AGCAGGTGTCTGGCGTGCTGGGCATCGAGGACTACTCGGTCAGCCAGACCACACTGGACA 7100 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

Db 1741 AG CAGGT GT C T G GC GT GCT G G GCAT C GAGGACT ACT C GGT CAGCCAGAC CACACT GGAC A 1800 

Qy 7101 AT GTGTTCGT GAAC T T T G C C AAG AAG C AG AG T G AC AAC C T G GAG C AG C AG GAG AC G GAG C 7160 

I I I I I II I I I I I I I II I I I I I I I I I I II II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AT GT GT T C GT GAACTTTGCCAAGAAGCAGAGT GACAACCTGGAGCAGCAGGAGACGGAGC 1860 

Qy 7161 CGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTG 7220 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1861 CGCCATCCGCACTGCAGTCCCCTCTCGGCTGCTTGCTCAGCCTGCTCCGGCCCCGGTCTG 1920 

Qy 7221 CCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACG 72 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

Db 1921 CCCCCACGGAGCTCCGGGCACTTGTGGCAGACGAGCCCGAGGACCTGGACACGGAGGACG 1980 

Qy 72 81 AGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCT 734 0 

I M I M I I I I I II I I I I I I I I I I I I I I M I I I I I I I I II I I I I I I I I I II I I I 

Db 1981 AGGGCCTCATCAGCTTCGAGGAGGAGCGGGCCCAGCTGTCCTTCAACACGGACACGCTCT 2040 

Qy 7341 GCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCC 74 00 

M I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I | | | | | | | | | | | | || | | | | | | | | | | | | | 

Db 2041 GCTGACCACCCAGAGCTGGGCCAGGGAGGACACGCTCCACTGACCACCCAGAGCTGGGCC 2100 

Qy 7401 AGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTT 7460 
II I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I 



Db 2101 AGGGACTCAACAATGGGGACAGAAGTCCCCCAGTGCCTGCCAGGGCCTGGAGTGGAGGTT 2160 

Qy 74 61 CAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTG 7520 

I I I I I M I I I I I II I I I I I I I I I I I I I I I | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | | 
Db 2161 CAGGACCAAGGGGCTTCTGGTCCTCCAGCCCCTGTACTCGGCCATGCCCTGCGGTCACTG 222 0 

Qy 7521 CGGTTGCCGCCCCTAATTGTGCCAAAGGCTGACCCGGCCCGGGCTGCGTACACCCTTGCC 758 0 

I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

Db 2221 CGGTTGCCGCCCCTAATTGTGCCAAAGGTTGACCCGGCCCGGGCTGCGTACACCCTTGCC 22 8 0 

Qy 7581 CTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCCTGCCTGGCACTGCTCA 7640 

I I I I I I I I I I I I Ill I I II I I I I I I I II II || I I I I I I I I I 

Db 2281 CTGCTTTGCCTTAAAGCCTCGGGGTCTGCCCGGCCCCTCGCCCATGCCTGGCACTGCTCA 234 0 

Qy 7641 CCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGG 7700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 2341 CCGCCCAAGGCGACGCCGGCTGGACCAGGCACTGCTGGCCTTTCTCCTGCCCGGCCTCGG 24 0 0 

Qy 77 01 AACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTG 7760 

I I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I II I II I I I I I 
Db 24 01 AACCAGCTTTTCTCTCTTACGATGAAGGCTGATGCCGAGAGCGGGCTGTGGGCGGAGCTG 24 60 

Qy 7761 GGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAG 782 0 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I | | || | | | 
Db 2461 GGTCAGTCCCGTATTTATTTTGCTTTGAGAAGAGGCTCCTCTGGCCCTGCTCTCCTGCAG 2520 

Qy 7821 GGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGG 78 8 0 

M I I I I I I I I I I I I I Ill II I 

Db 2521 GGAGGTGGCTGTCCCGCGGGAAGCCATCAGCTTGGGCCAGCTGGCAGGTGGCAGGAATGG 2580 

Qy 78 81 AGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATC 794 0 

I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I | | | | | | | | | | | M I I I I I I I I I I 
Db 2581 AGAAGCTGACCCTGCTGGCCAGGCAAGGGGCCAGACCCCCCCCAACCCCCAGCTGCCATC 264 0 

Qy 7941 GCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACAT 8 000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I | | I | | 
Db 2 641 GCTCTCCCACCCAGCTTGGCCCCCTGCCCGCCCACCTCCCTGGGAGCCGGGCCTGTACAT 27 00 

Qy 8001 AG C G C AC AG AT GTTTGTTT T AAAT AAAT AAAC AAAAT GT C 8 04 0 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I II I 
Db 2701 AGC G C ACAGAT GTTTGTTT TAAAT AAATAAACAAAAT GT C 2740 
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